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(57) Abstract 

The invention concerns a novel nucleic sequence and deduced protein sequence family with whole or partial human endogenous 
retroviral motifs. The invention also concerns the detection and/or the use of said nucleic sequences and said corresponding protein 
sequences or fragments of said sequences, for diagnostic, prophylactic and therapeutic uses, in particular for neuropathological conditions 
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(57) ADi-ege" 

Nouvelle famille de sequences nucl6iques et de s6quences prot6iques decluites, qui pr^sentent des motifs r6troviraux endog6nes 
humains complets ou partiels. Detection et/ou utilisation desdites sequences nucleiques et desdites sequences prot&ques correspondantes 
ou de fragments de ces sequences, dans le cadre duplications diagnostiques, prophylactiques et tlferapeutiques, en particulier pour des 
neuropathologies a composante autoimmune comme la sclerose en plaques. Lesdites sequences d'acide nucleique puriflf comprennent tout 
ou partie d'une sequence codant pour une sequence nStrovirale endog6ne humaine, qui presents au moins des motifs rdtroviraux de type 
env y repondant a la sequence SEQ ID NO:l ou a une sequence presentant un niveau d'homologie avec ladite sequence SEQ ID NO;l 
supeneur ou 6gal a 80 % sur plus de 190 nucleotides ou supeneur ou 6gal a 70 % sur plus de 600 nucleotides pour les domaines de type 
env. Utilisation des sequences flanquantes ou adjacentes desdites sequences et contr616es par ces dernieres, comme reactifs de diagnostic. 
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FAMILLE DE SEQUENCES NUCLEIQUES ET DE SEQUENCES PROTEIQUES DEDU1TES PRESENTANT DES MOTIFS 
RETROVIRAUX ENDOGENES HUMAINS, ET LEURS APPLICATIONS 

5 La presente invention est relative a une nouvelle famille de 

sequences nucleiques et de sequences proteiques deduites. qui presentent des motifs 
retroviraux endogenes humains complets ou paniels. ainsi que des sequences 
flanquantes ou adjacentefs desdites sequences, et controlees par ces dernieres : modifi- 
cation de P expression ou alteration de la structure (polyadenylation. epissage alter- 

1 0 natif . . . ) desdites sequences flanquantes. 

L'invention est egalement relative a la detection et/ou a Putilisation 
desdites sequences nucleiques et desdites sequences proteiques correspondantes. dans 
le cadre d' applications diagnostiques, prophylactiques et therapeutiques. en paniculier 
pour des neuropathologies a composante autoimmune comme la sclerose en plaques. 

15 L'invention concerne aussi Pobtention de sondes nucleiques double 

brins et simple brin anti-sens, de ribozymes, aptes a moduler la replication virale (T.R. 
Cech, Science, 1987, 236, 1532-1539 ; R.H. Symons, Trends Biochem. ScL, 1989, 14, 
445-450) des molecules recombinantes correspondantes, et des anticorps associes. 

Les retrovirus sont des virus qui se repliquent uniquement en utili- 

20 sant la voie inverse du traitement classique de Pinformation genetique.. Ce processus, 
nomme transcription inverse, est medie par une ADN polymerase ARN dependante ou 
transcriptase reverse, codee par le gene poL Les retrovirus codent aussi au minimum 
pour deux genes additionnels. Le gene gag code pour les proteines du squelette, ma- 
trice, nucleocapside et capside. Le gene env code pour les glycoproteines d'enveloppe. 

25 La transcription retrovirale est regulee par des regions promotrices ou " enhancers 

T 

situeesf dans des regions hautement repetees ou LTR {Long Terminal Repeat) et qui 
sont presentes aux deux extremites du genome retroviral. 

Lors de 1' infection d'une cellule, la polymerase fait une copie ADN 
du genome ARN ; -cette copie peut alors s'integrer dans le genome humain. Les retro- 
30 virus ne tuent pas les cellules qu'ils infectent, mais au contraire ameliorent souvent 
leur rapidite de croissance. Les retrovirus peuvent infecter des cellules germinales ou 
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des embryons a un stade precoce ; ils peuvent dans ces conditions, integrer^la lignee 
germinale et etre transmis par transmission mendelienne venicale. ce qui consume la 
relation ia plus etroite entre un hote et son parasite. Ces virus endogenes peuvent 
degenerer au cours des generations de Torganisme hote et perdre leurs proprietes ini- 
5 tiales. Cependant certains d'entre eux peuvent conserver tout ou partie de leurs pro- 
prietes ou des proprietes des motifs les composant, ou encore acquerir de nouvelles 
proprietes fonctionnelles presentant un avantage pour 1'organisme hote, ce qui expli- 
querait la preservation de leur sequence. 

V existence de motifs endogenes presentant de longs cadres de 

10 lecture ouverts et/ou soumis a une forte pression de selection peut done etre indicatrice 
d'une fonction biologique preservee ou acquise, qui peut correspondre a un benefice 
pour Forganisme hote. Ces sequences retrovirales peuvent aussi subir, au cours des 
generations, des modifications discretes qui vont etre a meme de reveiller certaines de 
leurs potentialites et engendrer ou favoriser des processus pathologiques. II est apparu 

15 recemment necessaire de faire le bilan et d ? identifier ces sequences afin de pouvoir 
evaluer leur impact fonctionnel. 

Les sequences retrovirales endogenes humaines ou HERVs repre- 
sented une part importante du genome humain. Ces regions retrovirales se presentent 
sous plusieurs formes : 

20 - des structures retrovirales endogenes completes associant des 

motifs gag, pol et env, flanques de sequences nucleiques repetees, qui montrent une 
analogie significative avec la structure LTR-gag-pol-env-LTR des retrovirus infec- 
tieux, 

- des sequences retrovirales tronquees ; par exemple, les retro- 
25 transposons sont prives de leur domaine env et les retroposons ne possedent pas les 
regions env et LTR. - ? 

Jusqu'a present 1'etude de ces regions du genome a ete negligee chez 
l'Homme pour deux raisons essentielles : 

-i Texistence d'insertions/deletions qui peuvent decaler le cadre de 
30 lecture et de mutations qui modifient la sequence. Ces modifications entrainent des 
alterations de la structure et par consequent de la fonction biologique de ces motifs. 
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- F absence d ? associations averees avec des pathologies humaines. 

La connaissance, recente de fragments significativement rgpresenta- 
tifs du genome humain et une orientation des recherches vers une etude struc- 
ture/fonction des motifs retroviraux endogenes, ont permis de preciser Finteret de ces 
5 regions. L/implication de sequences endogenes tronquees ou completes dans des 
pathologies chez F animal est documentee ; par exemple leur association avec des 
processus tumoraux a ete clairement mise en evidence (S.K. Chattopadhyay et coll.. 
1982, Nature, 295, 25-31). Une recherche visant a preciser F association ou F influence 
des HERVs dans des pathologies humaines se justifie done aujourd'hui. 
10 Une classification des elements HERV a ete proposee (Tonjes R.R. 

et ah, AIDS & Hum. Retroviral., 1996, 13, S261-S267; A.M. Krieg et aL FASEB J.. 
1992, 6, 2537-2544). Elle est basee sur une homologie de ces sequences avec des 
retrovirus isoles chez les animaux, a l'aide de sondes retrovirales heterologues. En 
effet, en general, les HERVs presentent relativement peu d'homologie avec des retro- 
1 5 virus infectieux humains connus. 

Les families de classe I presentent une homologie de sequence avec 
les retrovirus de mammiferes de type C ; on peut citer notamment la superfamille ERI, 
proche du virus MuLV (murine leukemia virus) et du virus BaEV (baboon endoge- 
nous virus). 

20 Les families de classe II presentent une homologie de sequence avec 

les retrovirus de mammiferes de type B tel que le MMTV (mouse mammary tumour 
virus) ou les retrovirus de type D tel que le SRV (squirrel monkey retrovirus). 

D'autres families ont egalement ete decrites ; parmi celles-ci, on peut 
citer des HERVs qui presentent, de maniere exceptionnelle, une homologie partielle 

25 avec HTLV-1 (RTVL-H) ou des virus de primates ; HRES-1, par exemple, presente 
une homologie de sequence avec des HTLVs. - - 

Les programmes de tres grand sequen?age du genome humain per- 
mettent aujourd'hui de disposer d'un nombre significatif de nouvelles sequences retro- 
virales. L'usage de^ logiciels de traitement de donnees permet d'identifier et d ? analyser 

30 ces genes. Dans ce contexte une recherche systematique portant sur Fensemble des in- 
formations disponibles a ce jour a ete engagee afin d' identifier de nouvelles sequences 
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retrovirales endogenes humaines en fonction de certains criteres d'analy^p : '* 

- presence de longs cadres de lecture ouverts conserves au cours de 
revolution de I'organisme hote et pouvant laisser envisager une fonction bioiogique. 

- analogie avec des sequences deja caracterisees en dehors ou dans le 
5 domaine des retrovirus, 

- localisation dans des regions de susceptibilite pour certaines patho- 
logies ou a proximite de genes essentiels, par exemple dans les domaine du cancer, des 
regulation du systeme immunitaire ou dans certaines neuropathologies. 

Les recherches effectuees par les Inventeurs, dans des bases de don- 
10 nees de sequences leur ont permis d'identifier un ensemble de sequences ou de motifs 
retro viraux endogenes dont P expression normale ou pathologique peut favoriser ou 
perturber un effet protecteur vis-a-vis de processus pathologiques. ou imervenir dans 
le declenchement ou F aggravation de pathologies. 

La presente invention a pour objet un fragment d'acide nucleique 
1 5 purifie, caracterise en ce qu'il comprend tout ou partie d'une sequence codant pour une 
sequence retroviral endogene humaine, qui presente au moins des motifs retroviraux 
de type env, repondant a la sequence SEQ ID NO:l ou a une sequence presentant un 
niveau d'homologie avec ladite sequence SEQ ID NO:l superieur ou egal a 80% sur 
plus de 1 90 nucleotides ou superieur ou egal a 70 % sur plus de 600 nucleotides pour 
20 les domaines de type env. 

On entend par sequence homologue, aussi bien une sequence qui 
presente une identite complete ou partielle avec la sequence SEQ ID NO:l precitee 
qu'une sequence qui presente une similarite partielle avec ladite sequence SEQ ID 
NO:L 

25 Selon un mode de realisation avantageux dudit fragment il presente 

a la fois des motifs retroviraux correspondant a un domaine e~rft et repondant a la 
sequence SEQ ID NO:l et des motifs retroviraux correspondant a un domaine gag et 
repondant a la sequence SEQ ID NO:2 ou a une sequence presentant un niveau 
d'homologie superieur ou egal a 80 % sur plus de 190 nucleotides ou superieur ou 

30 egal a 70 % sur plus de 600 nucleotides pour les domaines de type env et un niveau 
d'homologie superieur ou egal a 90 % sur plus de 700 nucleotides ou superieur ou 
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egal a 70 % sur plus de 1200 nucleotides pour les domaines de type^gag, lesquels 
motifs ne presentent aucune insertion ou deletion de plus de 200 nucleotides. 

Lesdits fragments constituent une nouvelle famille de sequences 
retrovirales endogenes humaines (famille HERV-7q) qui presente une homologie de 
5 sequence avec les retrovirus MSRV, tels que decrits dans la Demande Internationale 
WO 97/06260 ; lesdits fragments selon la presente invention presentent : 

- deux motifs nucleotidiques repetes de 71 1 pb (figure 3), presentant 
des signaux caracteristiques identifies dans des LTRs (Long Terminal Repeats) : 
promoteurs de transcription de type boites TATAA ou CCAAT. Ces domaines repetes 

10 encadrent trois motifs deduits de type-gag, pol et env (figure 2). 

- un motif de type env (positions 6965 nt - 9550 nt sur la sequence 
SEQ ID NO :3 ou sur la figure 1) qui contient un long cadre de lecture ouvert de 1620 
nucleotides (positions 7874-9493 de la sequence ID NO:3 et figure 1), codant pour 
une proteine de sequence inedite de 540 acides amines appelee enverine (figure 4 et 

15 SEQ ID NO:26) et fragment souligne de la figure 18. On retrouve a Finterieur du 
domaine trans-membranaire de ce domaine env, un motif peptidique de type CKS- 
25/CKS-17 (figure 5), reconnu pour presenter des fonctions immunosuppressives sur 
les cellules lymphocytaires hotes (M. Mitani et coll., 1987, Proc. Natl Acad. ScL 
USA, 84, 237-240). . Un domaine de type doigt de zinc {zinc-finger) HX 3 _,HX 22 . 

20 33 CX 2 C (Kulkolski et coll., 1992, Mol Cell Biol, 12, 2331-2338), que Ton retrouve 
dans des domaines de type integrase est identifie dans un autre cadre de lecture. Ce 
domaine env particulier signe la caracteristique de nouveaux motifs retroviraux 
endogenes. 

- le motif (positions 3065 nt - 4390 nt sur la sequence SEQ ID NO:3) 
25 de type-gag codant pour des motifs proteiques selon la figure 6 (SEQ ID NO:58) 

(positions 31 18-4198 de la SEQ ID NO:3) a ete identifie grace Ydes analogies avec 
des domaines gag connus. On retrouve, par exemple, la region d'homologie majeure 
QX3EX 7 R (Benit et coll., 1997, 1 Virol, 71, 5652-5657). Le motif de fixation des 
acides nucleiques CX 2 CX W HX4C, situe en position C-terminale, est identifie dans un 
30 autre cadre de lecture (Covey et coll., 1986, Nucleic Acids Res., 14, 623-633). En 
amont du domaine gag on detecte un motif de 182 nucleotides repete deux fois (figure 
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- le domaine pol presente les consensus classiques (Tune region pol 
de retrovirus au niveau des domaines protease, transcriptase reverse et RNAse H. On 
retrouve dans pol un motif proche du consensus LLDTGA (Weber et coll.. 1988. 

5 Science, 243, 928-931). Les motifs D et AF, LPQ et SP, et YVDD (Xiong et 
Eickbush, 1990, EMBO J., 9, 3353-3362), sont respectivement retrouves dans les 3°. 
4° et 5° boites d'homologie. Les motifs YTDGSS et TDS sont presents dans la region 
de la RNAse H, 

- les regions gag et pol pourraient etre considerees comme jointives 
1 0 avec un passage de la region gag a la region pol par un decaiage du cadre de lecture. 

La presente invention englobe les sequences appartenant a la famille 
HERV-7q telle que definie ci-dessus (presence de la sequence SEQ ID NO:l ou d'une 
sequence homologue ou presence a la fois des sequences SEQ ID NO: 1 et SEQ ID 
NO:2) et notamment les sequences SEQ ID NO:3-22, 28 et 61 ; elle englobe egale- 
15 ment les sequences nucleiques complementaires et les sequences inverses comple- 
mentaires des sequences precedentes ainsi que les fragments issus des regions 
codantes des sequences precedentes correspondant a un cadre glissant superieur ou 
egal a 14 nucleotides ou leurs sequences complementaires. (SEQ ID NO :37-57, 59-60 
et 121-122). 

20 Ces differents fragments peuvent avantageusement etre utilises 

comme amorces ou comme sondes (reactifs A) ; ils s'hybrident specifiquement dans 
des conditions de forte stringence a une sequence de la famille HERV-7q. 

Parmi ces fragments, on peut citer, de preference les fragments 

suivants: 

25 - un fragment de 182 nucleotides repete deux fois, situe en amont du 

domaine gag aux positions 2502-261 1/2613-2865 de la SEQ ID NO?3 ; 

Amorces et sondes specifiques de la region gap 

- une amorce GIF, sens, localisee dans la region amont du domaine 
gag de HERVrlq : 5' GGACCATAGAGGACACTCCAGGACTA 3' 

30 (SEQIDNO:37); 

- une amorce G1R ; anti-sens, localisee dans la region 3* terminale du 
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domaine gag : 5' CCTCAGTCCTGCTGCTGGATCATCT 3 ' (SEQ ID ®0:&) 

- le fragment de 1505 nt amplifie par le couple G1F-G1R est utilise 
afin de_generer les sondes aptes a hybrider les differents produits d'amplification des 
PCR ; 

5 - une amorce G2F, sens nichee : (SEQ ID NO:39) 

5' CCTCCAAGCAGTGGGAGGAAGAGAATT 3' 

- une amorce G2R, anti-sens nichee : (SEQ ID NO:40) 
5' CCTTCCCTGTGTTATTGTGGACATCATT 3' 

- une amorce G4F, sens nichee : (SEQ ID NO:4 1 ) 

10 5 ' GG AAG AAGTCTATGAATTATTC AATG ATGT 3 * 

- une amorce G3F, sens nichee: (SEQ ID NO:42) 

5 ' GGGACAC AGAATC AG AAC ATGGAG ATT 3 ' 

- une amorce G4R, anti-sens nichee : (SEQ ID NO:43) 
5 ' GCCTTCAG AAGAGTC AGGTGAC AGAG A 3 ' 

15 - une amorce GSR, anti-sens nichee : (SEQ ID NO:44) 

5 ' G AGCCTCC AAAGTCC ACTTGCCTGA 3' 
Amorces et sondes specifiques de la region env 

- une amorce E1F, sens : (SEQ ID NO:45) 

5' GATTTCAGTATCTACTAGTCTGGGTAGAT 3' 
20 - une amorce E 1 R, anti-sens : (SEQ ID NO :46) 

5' CTAGGAAATCCAGCTAGTCCTGTCTCA 3' 

- le fragment de 2529 nt amplifie par le couple d'amorces E1F-E1R, 
est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'ampiification des PCR. 

25 - une amorce E2F, sens : (SEQ ID NO:47) 

5' CCAAGACAGCCAACTTAGTTGCAGACAT 3' 

- une amorce E2R, antisens : (SEQ ID NO:48) 

5' GGACGCTGCATTCTCCATAGAAACTCTT 3' 
Hune amorce E3F, sens : (SEQ ID NO:49) 
30 5' GCAATACTACATACACAACCAACTCCCAA 3' 
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- une amorce E3R, antigens : (SEQ ID NO:50) 

5' GGGGGAGGCATATCCAACAGTTAGTA 3' 

- une amorce E4F, sens : (SEQ ID NO:5 1 ) 

5' CCATCTACACTGAACAAGATTTATACACTT 3 ' 
5 - une amorce E4R, anti-sens : (SEQ ID NO:52) 

5 ' AATGCC AGTACCTAGTGC ACCTAGC ACT 3 ' 

- une amorce E5F ? sens : (SEQ ID NO:53) 

5' CGAATACAACGTAGAGCAGAGGAGCTTCGAA 3' 

- une amorce E6F, sens : (SEQ ID NO:54) 

10 5' AGCCCAAGATGCAGTCCAAGACTAAGAT 3 ? 

- une amorce E5R : (SEQ ID NO:55) 

5 ' GCGTAGTAG AGGTTGTGC AGCTGAG AT 3' 

- une amorce ExF : (SEQ ID NO:56) 
CCCTTACCAAGAGTTTCTATGGAGAAT 

1 5 - une amorce ExR : (SEQ ID NO:57) 

ACCGCTCTAACTGCTTCCTGCTGAATT 
Tous les oligonucleotides sont con9us pour pouvoir generer une 
amorce sens et une amorce anti-sens par un decalage de la sequence de 1* amorce de 
reference de 1 a 7 nucleotides vers le cote 5' ou vers le cote 3 ? : la modification de la 
20 sequence peut entrainer une modification de la taille de F amorce de 1 a 7 nucleotides 
selon les cas. Les amorces choisies peuvent etre optimisees selon les cas par un 
raccourcissement ou un allongement portant sur 1 a 9 nucleotides. 

De maniere preferee, Fhybridation. le clonage, le sous-clonage, 
1'obtention, la preparation et l'analyse des acides nucleiques, des peptides et des anti- 
25 corps, le sequen9age des acides nucleiques et des peptides, Fhybridation in situ et 
Fimmunohistochimie sont realises dans les conditions decrites 'dans les ouvrages 
suivants : 

- Current Protocols in Molecular Biology. Eds. F.M Ausubel, R. 
Brent & R.E Kingston et coll. Green Publishing associates and Wiley Interscience. 

30 - Molecular Cloning: a laboratory manual. Eds. J. Sambrook, E.F. 

Fritsch & T. Maniatis. Cold Spring Harbor Laboratory Press. Cold Spring Harbor. 
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- The Practical Approach series. Eds. D. Rickwood & B.D. Ames. 
IRL Press and Oxford University Press. En particulier, antibodies I & II; DNA cloning 
I, II, III; Nucleic acid and protein sequence analysis; Nucleic acid hybridization; 
Nucleic acid sequencing ; Oligonucleotide synthesis; Protein purification applications; 

5 Protein purification methods; Protein sequencing; Transcription and translation; Gels 
electrophoresis of nucleic acids; Gels electrophoresis of proteins; Genome analysis; 
HPLC of macromolecules; Human genetic diseases; Microcomputing in biology; 
Molecular neurobiology; Mutagenicity testing; Essential molecular biology I & II. 

- Proteome research; New frontiers in functional genomics. Eds 
10 M.R. Wilkins & coll.. Springer. 

La sequence retrovirale endogene humaine (SEQ ID NO:3). situee 
sur le bras long du chromosome 7 correspond a la sequence HERV-7q ; elle presente 
10,5 kb (fig. 1 et 2) et repond aux criteres precedemment definis. 

La recherche de domaines presentant des similitudes, tout ou partie, 

15 avec les regions gag et env de HERV-7q a abouti a T identification de nouvelles 
sequences retrovirales endogenes. Ces sequences peuvent presenter la structure d ? un 
retrovirus endogene complet comme la sequence retrovirale endogene situee a proxi- 
mite du gene des sous-unites alpha et delta du recepteur des cellules-T, et denommee 
en consequence HERV-TcR ; a titre d'exemple la figure 7 montre la comparaison des 

20 alignements nucleiques des domaines gag respectifs de HERV-7q et HERV-TcR 
(sequence HG12, SEQ ID NO; 19). On trouve aussi des structures retrovirales 
partielles. Ces domaines retroviraux similaires a HERV-7q sont identifiees dans des 
sequences nucleiques independantes comme le montre leur localisation chromo- 
somique. Des motifs nucleiques (appeles ici, HEx ou HGx et respectivement analo- 

25 gues a des domaines de type env ou gag) ressemblant aux domaines env ou gag de 
HERV-7q ont ete retrouves, a Taide des banques de donnees precipes : 

- HE2 : chromosome 1 7 (SEQ ID NO:4), 

- HE3 et HG3: chromosome 6 (SEQ ID NO:5 et 6), 
4HE4 ; chromosome X (SEQ ID NO:7), 

30 - HE5 : chromosome X q22 (SEQ ID NO:8), 

- HE6 et HG6 ; chromosome 1 q23.3-q24.3 (SEQ ID NO:9 et 10), 
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- HE7 : chromosome 7 pl5 (SEQ IDNO:l 1), * ' 

- HE8 et HG8 : chromosome 1 9 (SEQ ID NO: 1 2 et 1 3). 

- HE9 : chromosome X (SEQ ID NO: 14), 

- HE10 : chromosome X ql3.1-2Ll (SEQ ID NO: 15), 

5 -HEM etHGll : chromosome 7 q2 1-22 (SEQ ID NO: 16 et 17), 

- HE12 et HG12, dans HERV-TcR : chromosome 14 ql 1 .2 (SEQ ID 

NO:18et 19), 

- HE13 (SEQ ID NO:61) : chromosome 6 q24.1-24.3 

La presente invention englobe egalement les fragments codants et 
10 non codants pour tout ou partie de Tenverine comprenant au moins 14 nucleotides et 
notamment les fragments codant pour la partie C-terminale de Penverine, soit a partir 
de 1'acide amine 291, soit a partir de Tacide amine 321, a compter de la premiere 
methionine. 

Ces fragments comprennent en particulier une zone critique ou deux 
15 insertions de 12 nucleotides ont ete caracterisees : 

- une premiere insertion a ete identifiee (sequence A), chez des iridi- 
vidus de 2 groupes (malades et temoins). Cette insertion situee entre les acides amine 
487 et 488, permet d'inserer le tetrapeptide VLQM Une analyse comparative montre 
que cette insertion est identifiee dans une region homologue situee dans la sequence 

20 HE13, appartenant a la famille HERV-7q. L'amplification de la sequence de type 
HE13, pourrait indiquer qu'il existe une alteration de la sequence de l'enverine de 
HERV-7q, ce qui favoriserait Tamplification de la sequence contenue dans HE 13. 
Cette observation permet aussi d'utiliser cette insertion comme element specifique 
d' amplification de sequences de type HE 1 3 . 

25 Une deuxieme insertion (sequence B) a ete identifiee chez un patient 

presentant une SEP. LMnsertion de 12 nucleotides est situee aq niveau de Tacide 
amine 495 et code pour le tetrapeptide MQSM. II est remarquable de constater que 
cette insertion est aussi identifiee dans une region homologue situee dans HE1 3. 

Sequence A: TAAACTACAAATGG TTCTTCAAATGG AGCCCA 

30 (SEQIDNO:59) 
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Sequence B: GATGCAGTCCAAGA TGCAGTCCATGA CTAAGA 

(SEQ ID NO:60). 

Ces observations mettent en evidence des modifications de la 
sequence de 1'enverine de type HERV-7q qui constituent la base d'une strategic de 
5 detection par amplification specifique d' alleles (AS-PCR), permettant de detecter ces 
differences dans une population et qui pourraient corresponds soit a une muta- 
tion/deletion associee a une certaine susceptibility soit a un polymorphisme, soit a une 
mutation/deletion associee a une pathologie comme la sclerose en plaques. 

Les alignements des domaines env (fig. 8) et gag (fig. 9) explicitent 
10 les niveaux d'homologie observes entre les sequences decrites ci-dessus et les sequen- 
ces homologues dans HERV-7q. Les analogies peuvent s'etendre aux motifs retro- 
viraux flanquants. 

Une analyse des sequences etiquettes disponibles dans les banques 
de donnees montre que des transcrits appartenant a certains des membres de cette 
15 famille, en particulier HERV-7q, s'expriment essentiellement dans des tissus d'origine 
foetale ou placentaire. 

Des sequences polypeptidiques generees par ces transcrits peuvent 
done etre potentiellement produites et des fonctions ou activites biologiques peuvent 
etre envisagees, par analogie avec des polypeptides biologiquement actifs d'origine 
20 virale ou retro virale ; par exemple, les motifs peptidiques de type CKS-17 (Haraguchi 
et al., PNAS, 1995, 92, 5568-5571) (fig. 5) ou CKS-25 (Huang S.S et Huang J.S, J. 
Biol Chem. 1998, 273, 4815-4818), qui presentent des fonctions immunomodulatrices 
sur les cellules lymphocytaires hotes. Les differences de sequence observees et 
d'eventuelles modifications normales ou pathologiques, sont en particulier, a Torigine 
25 d'une modulation de la fonction. 

HERV-7q represente le paradigme de la ndivelle famille de 
sequences retrovirales endogenes humaines ou de motifs retroviraux endogenes. 

HERV-7q et certaines des sequences retrovirales endogenes apparte- 
nant a sa famille, presentent un domaine de type pol analogue a des sequences retro- 
30 virales de type pol comme par exemple la region pol identifiee dans le retrovirus 
MSRV associe a la sclerose en plaques et decrit par H. Perron et al. (1997, Proc, Natl. 
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Acad Sci. USA, 94, 7583-7588 ; Demande Internationale PCT WO 97/0626$. 

Toutefois, les sequences selon la presente invention se distinguent 
des sequences retrovirales exogenes infectieuses analogues a MSRV anterieurement 
decrites en ce que les sequences gag et env y selon Finvention sont significativement 
5 differentes selon les criteres precedemment definis et en fonction de certaines caracte- 
ristiques specifiques, par exemple le long cadre de lecture ouvert du domaine env de 
HERV-7q ; elles seraient a meme de permettre de signer une pathologie lorsqu'elles 
presentent des insertions, des deletions, des decalages de cadre de lecture ou des 
mutations. 

10 En effet, les differences observees entre les sequences humaines de 

type HERV-7q, qui sont isolees d'individus reputes normaux et les sequences issues 
de certains echantillons d'origine pathologique, ne sont pas distributes au hasard. Des 
comparaisons menees entre la region gag provenant de particules retrovirales infec- 
tieuses (N° d'accession EMBL: A60168, A60200, A60201, A60171...) et la sequence 

15 gag correspondante de HERV-7q (fig. 9), permettent d'observer que les mutations 
affectent preferentiellement des codons non-sens. Par exemple. deux codons non-sens 
dans HERV-7q sont remplaces par un codon arginine dans A60200, ce qui permet 
d'obtenir une sequence deduite de 109 acides amines pour HERV-7q et de 166 acides 
amines pour A60200. Les changements de base permettent en consequence de prolon- 

20 ger le cadre de lecture et de coder potentiellement pour des structures polypeptidiques 
de plus grande taille (figure 10). 

De meme, une sequence de type env provenant de particules retro- 
virales infectieuses, presente une analogie significative avec le domaine env de 
HERV-7q (figure 1 1). Ces analogies marquees entre sequences retrovirales exogenes 

25 et endogenes pourraient etre a Forigine du declenchement ou de Faggravation de 
certains processus pathologiques, en particulier de certaines malapies auto-immunes, 
comme la sclerose en plaques. A cet egard, on peut remarquer que certaines des 
sequences retrovirales endogenes decrites dans Finvention se situent a proximite ou 
dans des regions reputees presenter une susceptibilite pour la sclerose en plaques : par 

30 exemple HERV-7q et la region 7q21-22 du chromosome 7, de meme pour HE 12 et 
HG12 dans HERV-TcR et la region du gene codant pour les chaines alpha et delta du 
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recepteur des cellules-T, HE2 et le chromosome 17, ou HE3, HE13"*et HG3 et le 
chromosome 6, par exemple, les sequences HE1 1 et HG1 1, autour de la region 7q 21- 
22 ou encore HE4, HE5, HE6, HE9, HE 10 ou HG10 stir le chromosome X. Ces 
sequences seraient done a meme de fournir des moyens de localisation ou 
5 d'identification des genes de predisposition. 

On n'observe aucune homplogie significative avec des sequences 
retrovirales endogenes deja decrites, par contre, on peut relever une homologie 
limitee, permettant d'identifier une structure generate de domaine env ; toutefois, 
ladite homologie est inferieure aux criteres definis selon V invention entre les 

10 domaines env de la sequence HERV-7q (SEQ ID NO :1) et de la sequence HERV-9 
(figure 12). La figure 1 1 montre des homologies etendues entre la sequence HERV-7q 
avec une sequence retro virale exogene (N° d'accession EMBL : A60170). 

Les sequences retrovirales endogenes humaines appartenant a la 
famille de HERV-7q, peuvent proteger contre des agressions liees a Tenvironnement 

15 ou constituer un benefice pour Tindividu. Cet effet benefique pourrait etre une des 
raisons possibles de la pression de selection exercee sur certaines de ces sequences et 
du caractere potentiellement fonctionnel des structures proteiques deduites identi- 
fiees : par exemple le long cadre de lecture ouvert apte a coder pour une nouvelle pro- 
teine et correspondant au domaine env de HERV-7q. 

20 Les sequences retrovirales endogenes humaines appartenant a la fa- 

mille de HERV-7q pourraient etre associees par exemple, a des pathologies en relation 
avec les processus lies au cancer, aux neuropathologies a composante auto-immune ou 
a tout autre processus pathologique en association ou non avec des virus ou retrovirus 
endogenes ou exogenes. Leur action pourrait porter sur la declaration, 1' aggravation, la 

25 modification du calendrier d'apparition ou encore la protection vis a vis de la maladie. 

Dans le contexte d' application a des pathologies autoimmunes 
(comme par exemple le lupus, le syndrome de Sjogren, la polyarthrite rhumatoYde, la 
sclerose en plaques...), on peut relever des analogies significatives entre les motifs re- 
troviraux endogenes identifies et des motifs retrouves dans des structures retrovirales 

30 caracterisees chez des patients presentant des pathologies autoimmunes comme la 
sclerose en plaques : par exemple des fragments de domaine gag (recemment dispo- 
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nibles dans les banques de donnees) provenant de particules retroviraies infectieuses 
ou encore la sequence complete du domaine pol correspondant au virus MSRV associe 
a la sclerose en plaques. Ces motifs retroviraux possedent des analogies significatives 
avec les sequences endogenes homologues de type HERV-7q, ce qui permet 
5 d'envisager une association directe ou indirecte avec des processus pathologiques, 
dont la sclerose en plaques, en association ou non avec MSRV ? 

L'interet de ces . sequences depasse le cadre des maladies auto- 
immunes. En dehors de r importance generate des motifs retroviraux dans le declen- 
chement ou r aggravation d'un processus tumoral, bien montre en particulier dans les 

10 modeles murins (H. Fan dans The retroviridiae, 1994, ed. J. A. Levy, Plenum, New 
York, p. 313-353), ces sequences pourraient se retrouver a proximite ou au sein de 
genes importants et en alterer l'expression : par exemple HERV-TcR et les genes des 
sous-unites alpha et delta du recepteur des cellules T impliquees dans des perturba- 
tions de la fonction immunitaire. 

15 La presente invention englobe, en outre, P utilisation de sequences 

associees aux sequences de la famille HERV-7q pour la detection et/ou le pronostic de 
differentes maladies auto-immunes (neuropathologies, en particulier) ; ces sequences 
codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation ou 
Talteration (polyadenylation, epissage alternatif) est associee a Texpression normale 

20 ou pathologique ou a la regulation/deregulation des motifs appartenant a la famille 
HERV-7q et correspondent a des transcrits ou des ADNc des sequences nucleotidiques 
codant pour des genes situes dans des regions flanquantes ou encadrant des sequences 
retroviraies de la famille HERV-7q. 

On entend par region flanquante, toute region situee a proximite 

25 (incluse dans ou incluant) une sequence retrovirale endogene appartenant a la famille 
HERV-7q, telle que definie ci-dessus, jusque et y compris les genes immediatement 
contigus et/ou situes a une distance ne pouvant exceder 120 kb. 

Les Inventeurs ont maintenant trouve que la presence des sequences 
retroviraies telles que definies ci-dessus, perturbent V expression ou alterent la struc- 

30 ture des sequences flanquantes definies ci-apres. 

Les transcrits desdites sequences flanquantes (et leurs fragments, 
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notamment ceux soulignes ou en italique dans les figures 14-16, 22-26? sont definies 
ci-apres : 

- a 1021 pb en amont de HERV-7q, on identifie une sequence retro- 
virale endogene appelee RH7 (SEQ ID NO:62 et figure 22) ; cette sequence est situee 

5 en 5 5 de la sequence HERV-7q ; dans la figure 22, la partie en italique correspond au 
debut de la sequence HERV-7q ; la sequence RH7 est soulignee ; deux sites de 
polyadenylation putatifs sont en gras. Cette sequence SEQ ID NO: 62 presente une 
homologie significative, sur plus de 6 kb, avec des sequences retrovirales endogenes 
de type RGH (figure 13). Des sequences appartenant a cette famille s'expriment en 

10 particulier chez des patients presentant une arthrose rhumatoi'de (Nakagawa et coll., 
(1997), Arthritis. Rheum., 40, 627- 638). La presente invention inclut egalement des 
fragments de la sequence SEQ ID NO:62, comprenant entre 14 et 50 nucleotides 
(utilisation comme amorces), de preference entre 14 et 25 nucleotides ou au moins 25 
nucleotides (utilisation comme sonde), lesquels fragments presentent les caracteris- 

15 tiques suivantes : les 4 nucleotides de Pextremite 3' sont differents des motifs corres- 
pondant de la sequence RGH2 (sequence du bas dans la figure 13, n° accession a 
GenBank:D110 18). 

- a moins de 9 kb en amont de HERV-7q, on identifie la sequence 
RAM75 (SEQ ID NO:63 et figure 14) contenant les 24 exons codants (qui couvrent 

20 pres de 41 kb), du gene de PATPase peroxysomale PEX1. PEX1, en association avec 
PEX6 est responsable de F importation des proteines peroxysomales et de la stabilisa- 
tion du recepteur PEX5. Une perturbation/alteration affectant PEX1 est responsable de 
diverses neuropathologies comme le syndrome de Zellweger, Fadrenoleucodystrophie 
neonatale et la forme infantile de la maladie de Refsum (Reuber et coll., (1997), 

25 Nature Genet., 17, 445- 448). On peut rappeler que la fonction principale des peroxy- 
somes est associee au metabolisme des acides gras, en particulier par des processus de 
P-oxydation. Une alteration du gene identifie dans la sequence RAM75 ou de son 
expression, par modification de la fonction des regions 5 5 et 3' regulatrices ou encore 
par modification des epissages ou des processus de polyadenylation, en particulier 

30 sous Tinfluence de motifs retroviraux voisins, seraient a meme de perturber 
T expression ou la structure de l'ATPase et par consequent de perturber une des 
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fonctions peroxysomales, en parti culier le metabolisme des lipides,^n particulier 
myeliniques, avec des consequences pour certaines pathologies, dont des neuropatho- 
logies, comme la sclerose en plaques ; les parties soulignees (figure 14) correspondent 
aux 24 exons codants. 

5 La presente invention inclut egalement les fragments de la sequence 

SEQ ID NO:63, inclus dans les 24 exons codants precites et comprenant au moins 14 
nucleotides. 

L'analyse du profil d'expression (transcrits et proteines) de la 
sequence RAM75 (SEQ ID NO:63) est un bon indicateur du diagnostic differentiel des 
1 0 neuropathologies a composante auto-immune. 

A la figure 14, les exons codants sont soulignes. Les codons 
d'initiation et non-sens ainsi que les sites putatifs de polyadenylation sont en gras et 
soulignes. 

- a 0.7 kb en aval de la sequence HERV-7q et sur pres de 17 kb 
15 (SEQ ID NO:64 et figure 15), on identifie la sequence nucleotidique RAV73, oil Ton 

detecte des sequences etiquettes et des exons potentiels aptes a produire une ou 
plusieurs sequences polypeptidiques ; 1' invention inclut egalement des fragments de 
cette sequence SEQ ID NO:64 compris dans les sequences etiquettes et les exons 
potentiels tels qu'ils apparaissent (parties soulignees) a la figure 15, lesquels 
20 fragments component au moins 1 4 nucleotides. 

- a 120 kb en amont de la sequence HG3, et sur 15 kb, se trouve la 
sequence nucleotidique RBP3 (SEQ ID NO:65 et figure 23), qui couvre Textremite 
3'du gene codant pour un facteur de transcription de la famille Blimp- 1 (SEQ ID 
NO:119 et figure 25), une proteine de 789 acides amines qui est un represseur de 

25 Fexpression du gene de l'interferon-beta (Keller et Maniatis, Genes Dev., (1991), 5, 
868-879), qui est deja associe a certaines pathologies malighfes (Mock et coll., 
Genomics, (1996), 37, 24-28), et qui pourrait jouer un role dans la differenciation et la 
pathogenese des cellules B. L'interet de l'association possible de la sequence retro- 
viral endogene cdntenant les motifs HG3 et HE3 et de Blimp- 1 est multiple, dans le 

30 cas de pathologies, et en particulier la sclerose en plaques. Blimp- 1 agit en particulier 
sur les cellules B dont on connait la contribution dans, les processus inflammatoires 
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associes a la sclerose en plaques. Blimp-1 est capable de bloquer 1' induction virale du 
promo teur INF (3 dont on connait T aptitude a reduire la frequence des pou'ssees et la 
progression lesionnelle chez des patients atteints de SEP. Une perturbation de 
F expression ou de la structure de Blimp-1, en relation avec un element retroviral de 
5 type HERV-7q, est associee en consequence a des neuropathologies ou a des maladies 
a caractere auto-immun, comme la sclerose en plaques ; cette sequence nucleotidique 
RBP3 (SEQ ID NO:65) contient des motifs nucleotidiques identifies dans la sequence 
nucleique codant pour le gene Blimp-1 ; Tinvention inclut aussi la detection des 
sequences ARNm de laproteine Blimp-1 (SEQ ID NO: 119). 

10 - la sequence retrovirale endogene de type HERV-7q. contenant HE3 

et HG3, se trouve situee dans la region HI3 correspondant a un intron s'etendant sur 
plus de 46 kb (SEQ ID NO:66), d'un gene qui pourrait coder pour F analogue d'APS 
(figure 24), une proteine de 275 acides amines specifique d'apoptose, surexprimee 
dans differents cellules en culture apres declenchement d'un processus apoptotique 

15 (Hammond et coll., FEBS Lett., (1998), 425, 391- 395). I/intron se situe au niveau de 
Facide amine 231 d'APS. L'extremite de HE3 est a plus de 12 kb de Fextremite 5' de 
Tintron, alors que HG3 est situe a plus de 28 kb de Textremite 3' de Fintron. Des 
processus apoptotiques sont associes a la sclerose en plaques. En particulier, il a ete 
decrit un processus apoptotique affectant des astrocytes et des oligodendrocytes en 

20 presence d'une fraction purifiee de liquide cephalo-rachidien de patients atteints de 
sclerose en plaques (Menard et coll., J. Neurol. Sci., (1998) , 154, 209- 221). 

Enfin, il faut souligner que la region nucleique contenant HE3, HG3, 
HI3 et RBP3 est localisee au niveau du bras court du chromosome 6, en 6p2K qui est 
une region proposee de susceptibilite a la sclerose en plaques (The Multiple Sclerosis 

25 Genetic Group, Nature Genet, (1996), 13, 469- 472). 

L' interaction entre les sequences de type HERV^7q et les sequences 
flanquantes et Fimportance de Tetablissement d'un profil d'expression incluant une ou 
plusieurs des sequences precitees pour etablir un diagnostic differentiel d'une neuro- 
pathologie apparait encore plus du fait que Ton observe que les sequences HG12 et 

30 HE12 sont situees dans une region intronique du gene codant pour les sous-unites 
alpha et delta des recepteurs des cellules T. Les recepteurs des cellules T sont impli- 
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ques dans les processus de regulation immunitaire et leur influence a"*ete proposee 
dans le cas de maladies auto-immunes, dont la sclerose en plaques. 

L/invention a egalement pour objet les transcrits generes a partir des 
sequences precitees ainsi que celles presentant eventuellement des modifications avec 
5 les sequences de reference decrites dans Finvention lorsqu'ils sont exprimes chez 
certains patients. 

En effet, les systemes de regulation de F expression des proteines 
retrbvirales de HERV-7q, qui sont presents dans les motifs de type LTR, pourraient 
influencer Fexpression de genes situes dans le voisinage chromosomique proche ou 

10 eloigne et induire des perturbations a caractere immunologique et/ou neurologique. 
Par exeriiple la sequence retroviral endogene HERV-TcR, se trouve a proximite 
immediate des genes des sous-unites alpha et delta du recepteur des cellules-T prece- 
demment decrit. Les motifs de type LTR pourraient aussi coder pour des superanti- 
genes (Acha-Orbea et Palmer, 1991, Immunol Today y 12, 356-361). D'une maniere 

15 generale des proteines retro virales de type HERV-7q ou apparente, ou leurs formes 
tronquees ou partielles pourraient etre impliquees dans des phenomenes de cytotoxi- 
cite ou de superanteginicite, comme par exemple celles issues du long cadre de lecture 
ouvert identify dans le domaine env (figure 4). 

Des sequences du type des LTR 5 ? et 3 ? de HERV-7q, fortement 

20 conservees sont concernees par de tels effets regulateurs. A titre d'exemple on decrit 
LTX, une sequence comparable a celle d'une LTR de HERV-7q (SEQ ID NO:67 et 
figure 16), et qui se trouve au coeur d'un intron de plus de 49 kb, mais a 2 kb du site 5' 
donneur, du gene de FMR2 associe au X-fragile et codant pour une proteine de 1311 
acides amines (figure 26). Les LTR modulent l'epissage altematif (Kapitonov et 

25 Jurka, (1999), J. MoL Evol., 48, 248- 251), Fexpression du gene, la fixation sur des 
proteines nucleaires (Akopov et coll., (1998), FEBS Lett., 42 L 229- 233), ou permet- 
tent Fobtention d'un signal de polyadenylation altematif (Goodchild et coll., (1992) , 
Gene, 121,287-294). 

D'une maniere generale, on peut remarquer Fexistence de plusieurs 

30 sequences retrovirales endogenes de type HERV-7q (HE4, HE5, HE9, HE10), situees 
au niveau du chromosome X qui represente le chromosome associe au plus grand 
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nombre de pathologies. * 

A cet egard, on peut relever que des motifs retroviraiix issus de 
regions -defectives SOnt aptes a presenter des fonctions biologiques: par exemple. la 
proteine d'enveloppe p!5E issue de motifs retro viraux defectifs, possede une activite 
5 anti-inflammatoire et immunosuppressive (Snyderman et Ciancolo, 1984, Immunol. 
Today, 5, 240-244). 

Ces structures sont vraisemblablement a meme de provoquer des 
breches ou d'amplifier des deregulations dans les processus de defense immunitaire. 
Certains des motifs des domaines gag, env et de type LTR peuvent etre associes a une 

10 fonction particuliere ou peuvent contribuer a la fonction normale ou pathologique des 
domaines flanquants tels que definis ci-dessus (SEQ ID NO:62-67). Des recombinai- 
sons avec un element d'origine exogene, retroviral ou non, peut dormer lieu a la 
production de motifs nucleiques ou proteiques qui pourraient soit proteger, soit 
declencher, ou favoriser ou aggraver une pathologic De meme, une structure retro- 

15 virale contenant des elements retro viraux endogenes selon 1' invention seraient a meme 
de provoquer un processus pathologique apres passage par un cycle transitoire 
exogene puis reintegration dans une region sensible ou critique du genome humain. 

On peut ainsi obtenir des profils d ? expression (transcrits et even- 
tuellement proteines) qui correspondent aux neuropathologies precitees. 

20 De meme, la combinaison de motifs appartenant a la famille de 

HERV-7q, ou d' elements induits par des motifs appartenant a la famille de HERV-7q, 
avec des motifs d'origine ou induits de maniere exogene seraient a meme de pouvoir 
declencher, ou aggraver un processus pathologique ou au contraire de favoriser une 
protection ou une remission partielle ou une guerison totale et definitive. 

25 La detection rendue possible des domaines de type HERV-7q, 

suggere des applications possibles a la fois au niveau prophylacti4ue, du pronostic et 
du diagnostic : par exemple des approches immunologiques ou d'amplification 
genique permettant de comparer des individus normaux servant de reference avec des 
patients, seraient almeme de favoriser le depistage, d'ameliorer la detection precoce de 

30 la declaration de la maladie et/ou de suivre revolution d'une pathologie chez des 
patients pouvant presenter une susceptibilite ou ayant declare la maladie ou encore 
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chez des individus consideres comme normaux, selon les criteres cliniquss actuels. 

Les sondes nucleiques et immunologiques specifiques; telles que 
definies, dans la presente invention sont a meme de favoriser Identification et la 
detection de motifs anormalement exprimes dans le cadre de pathologies associees au 
5 cancer, ou de neuropathologies en particulier auto-immunes, au premier rang 
desquelles la sclerose en plaques. 

La presente invention a egalement pour objet des sequences 
nucleiques hybrides, caracterisees en ce qu'elles comprennent des sequences ou motifs 
appartenant a la famille de HERV-7q, ou d'elements induits par des motifs apparte- 
10 nant a la famille de HERV-7q, avec des motifs d'origine ou induits de maniere 
exogene (sequences retrovirales exogenes) ; de telles sequences hybrides sont vrai- 
semblablement a meme de pouvoir declencher, ou aggraver un processus pathologique 
ou au contraire de favoriser une protection ou une remission partielle ou une guerison 
totale et definitive. 

15 La presente invention a egalement pour objet un reactif de diagnostic 

pour la detection differentielle de sequences nucleiques endogenes humaines 
completes ou partielles, presentant des motifs retroviraux, selectionnes parmi les 
sequences SEQ ID NO :1 et/ou SEQ ID NO ;2, caracterise en ce qu'il est selectionne 
dans le groupe constitue par les sequences SEQ ID NO: 1-22, 28, 37-57, 59-6 1 et 121- 

20 122, les sequences nucleiques complementaires et les sequences inverses comple- 
mentaires des sequences precedentes, par les fragments nucleotidiques capables de 
definir ou d'identifier les sequences SEQ ID NO:l et/ou SEQ ID NO:2 et toute 
sequence flanquante ou les chevauchant ainsi que par les fragments issus des regions 
codantes des sequences SEQ ID NO: 1-22 et 61, correspondant a un cadre glissant 

25 superieur ou egal a 14 nucleotides ou leurs sequences complementaires, eventuelle- 
ment marquees avec un marqueur approprie ainsi que par les sequences telles que 
definies aux figures 1 8-2 L 

Les sequences des sondes nucleiques, ribonucleiques et oligo- 
nucleotidiques utilisees seront choisies dans les regions env et gag ou leur regions 

30 flanquantes : par exemple les oligonucleotides amorces pour HERV-7q, seront choisis 
dans les regions situ&s entre les nucleotides 3065 et 4390, les nucleotides 6965 et 
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9550 ou les nucleotides 2502-2865 de la SEQ ID NO:3, ainsi que dans f ute sequence 
adjacente (amont ou aval) capable de permettre une amplification specifique (figure 
1). - 

Parmi les marqueurs appropries, on peut citer, les isotopes radio- 
5 actifs, les enzymes, les fluorochromes, des marqueurs chimiques (biotine), les 
haptenes (digoxygenine) et les anticorps ou analogues de bases appropriees. 
De maniere preferee : 

- ledit reactif est selectionne parmi les sequences SEQ ID NO:37-57 
et est apte a etre utilise comme amorce. 
10 - ledit reactif est selectionne parmi les sequences suivantes : 

un fragment de 1505 nt amplifie par le couple d'amorces SEQ 
ID NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 

un fragment de 2529 nt amplifie par le couple d'amorces SEQ 
ID NO:45 et SEQ ID NO:46 (amorces E1F et E1R), 
15 un fragment de 1 82 nucleotides repete deux fois, situe en amont 

du domaine gag aux positions 2502-261 1/2613-2865, 

des fragments codants ou non-codants pour tout ou partie de 
Fenverine, comprenant au moins 14 nucleotides et notamment les fragments codant 
pour la partie C-terminale de Fenverine, soit a partir de Tacide amine 291, soit a partir 
20 de Tacide amine 32 1, a compter de la premiere methionine, 

et est apte a etre utilise comme sonde. 

La presente invention a egalement pour objet un procede de detec- 
tion rapide et differentiel des sequences nucleiques retrovirales endogenes de type env 
ou env et gag, de leurs variants normaux ou pathologiques, par hybridation et/ou 
25 amplification genique, realise a partir d'un echantillon biologique, lequel procede est 
caracterise en ce qu'il comprend : " y 

(a) une etape dans laquelle Ton met en contact un echantillon biolo- 
gique a analyser ayec au moins une sonde telle que definie ci-dessus et 

(b) une etape dans laquelle on detecte par tout moyen approprie, le 
30 ou les produits resultant de Tinteraction sequence nucleotidique-sonde. 

Gonformement audit procede, il peut comprendre : 



WO 99/67395 / PCT/FR99/01513 

22 

* prealablement a T etape (a) : * 

. une etape de preparation du tissu ou du liquide biologique 

concerns, 

. une etape d'extraction de Tacide nucleique a detecter, et 
5 . au moins un cycle d' amplification genique et 

* posterieurement a T etape (b) : 

. une etape de comparaison des sequences nucleiques obtenues dans 
ledit echantillon biologique avec les sequences retrovirales endogenes humaines selon 
Tinvention par tout moyen approprie et notamment par sequen9age, Southem-blot, 
10 coupure de restriction, SSCP ou toute autre methode permettant d'identifier une inser- 
tion ou une deletion ou encore une simple mutation entre les differentes sequences 
comparees. 

Conformement a Tinvention, les sequences retrovirales endogenes 
humaines selon Tinvention sont ainsi comparees aux sequences nucleiques presentes 
15 dans Techantillon biologique a analyser et permettent la detection de sequences 
homologues de patients atteints de pathologies, susceptibles de mettre en jeu une 
modification de leur genome. 

De maniere avantageuse, lesdites comparaisons geniques sont 
menees a partir d'ADN genomique provenant d'individus temoins et de patients. 
20 Une amplification genique classique par PCR sera menee a Taide 

d'amorces 5' -sens et 3' -antisens encadrant ou comprenant la zone a etudier (zone env 
ou zone gag). 

Egalement de maniere avantageuse, les sequences des sondes 
nucleiques, ribonucleiques et oligonucleotidiques utilisees sont choisies dans les 

25 regions env et gag ou leurs regions flanquantes : par exemple les oligonucleotides 
amorces pour HERV-7q, seront choisis dans les regions situees Sitre les nucleotides 
3065 et 4390 et les nucleotides 6965 et 9550, ainsi que dans toute sequence adjacente 
(amont ou aval) capable de permettre une amplification specifique (figure 1), comme 
precise ci-dessus. Elles sont de preference selectionnees dans le groupe constitue par 

30 un fragment de 1505 nt amplifie par le couple d'amorces SEQ 

ID NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 
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un fragment de 2529 nt amplifie par le couple cTamorces SEQ 
ID NO:45 et SEQ ID NO:46 (amorces E1F et E1R). 

L'etape d'amplification genique est notamment realisee a Faide 
d'une des techniques d'amplification genique suivante : amplification par la Q(3- 
5 replicase, PCR, LCR, ERA, CPR ou SDA. 

La presente invention a egalement pour objet des sequences 
chimeres, caracterisees en ce qu'elles sont constitutes par un fragment de 17 a 40 
nucleotides d ? une sequence flanquante telle que definie ci-dessus associee a un motif 
retroviral endogene de type HERV-7q comprenant entre 1 7 et 40 nucleotides, tel que 
10 defini ci-dessus. 

La presente invention a egalement pour objet un procede de detec- 
tion des transcrits, tels que definis ci-dessus ? caracterise en ce qu'il comprend : 

- le prelevement des ARN messagers provenant d'echantillons 
biologiques (tissus, cellules, fluides biologiques) temoins et d'un echantillon analogue 

1 5 prele ve chez des patients et 

- Fanalyse qualitative et/ou quantitative desdits ARNm, par hybri- 
dation in situ, par dot-blot, Northern-blot, RNAse mapping ou RT-PCR, a Taide d'un 
reactif de diagnostic tel que defini ci-dessus. 

La presente invention a egalement pour objet une methode de detec- 
20 tion et/ou devaluation d'une sur-expression/sous-expression ou d'une modification 
d'au moins 1'une des sequences ou fragments de sequences retrovirales ehdogenes de 
type HERV-7q et/ou de leurs sequences flanquantes associees, caracterisee en ce 
qu'elle comprend : 

- le depot sur un support approprie comme par exemple un filtre de 
25 nylon, une lame de verre ou leur equivalent, de l'ADNc ou son equivalent provenant 

de clones, de produits de PCR obtenus a partir d J ADN genomique! de produits de RT- 
PCR provenant de transcrits ou encore de sequences oligonucleotidiques specifiques, 
lesdites sequences d'ADN etant des sequences ou des fragments de sequences retro- 
virales endogenes\ de type HERV-7q et/ou leurs sequences flanquantes, telles que 
30 definies ci-dessus, constituees par les transcrits et ADNc des sequences genomiques, 
qui codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation 
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ou Talteration est associee a I'expression normale ou pathologique oa a la regula- 
tion/deregulation de motifs appartenant a ladite famiile HERV-7q, ces sequences 
correspondant a des sequences nucleotidiques codant pour des genes situes dans des 
regions flanquantes situees en amont et/ou en aval d ? une sequence retrovirale de ladite 
5 famiile HERV-7q et dont Tune des extremites ne peut se trouver a une distance 
excedant 120 kb, et/ou une sequence chimere telle que definie ci-dessus. 

- Fhybridation dudit support avec au moins une sonde marquee de 
maniere adequate obtenue, par exemple, par retrotransposition d'un melange d'ARN 
provenant de cellules,, de tissus ou de liquides biologiques provenant de temoins 

10 reputes normaux, de membres de populations ethniques differentes, de patients atteints 
de pathologies souvent associees a une expression de retrovirus, comme les processus 
tumoraux, ou comme les maladies auto-immunes, et 

- la detection des hybrides formes. 

Selon un mode de mise en oeuvre avantageux de ladite methode, 
15 ledit transcrit ou ADNc est selectionne dans le groupe constitue par les sequences 
SEQ ID NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant supe- 
rieur ou egal a 14 nucleotides ou leurs sequences complementaires. 

Selon un autre mode de mise en oeuvre avantageux de ladite 
methode, ledit support comprend en outre toute sequence retrovirale endogene ou 
20 exogene. 

La methode des puces a ADN (Bowtell, (1999), Nature Genet., 21, 
25- 32), est utilisee pour evaluer la modification de X expression de tout ou partie de 
certaines des sequences d'origine retrovirale de type HERV-7q et des sequences 
flanquantes. Brievement de TADN provenant de clones, de produits de PCR obtenus a 

25 partir d' ADN genomique, de produits de RT-PCR provenant de transcrits ou encore de 
sequences oligonucleotidiques specifiques, sont deposees sur un support, comme par 
exemple un filtre de nylon, une lame de verre ou leur equivalent. Les sequences 
nucleiques deposees couvrent les differents domaines retroviraux decrits ci-dessus, 
ainsi que les sequences contigues et les genes flanquants. Afin de detecter d'eventuels 

30 processus d'epissage alternatifs, des ADN specifiques sont synthetises par pas de 500-. 
600 nucleotides avec un chevauchement de 250- 300 nucleotides de part et d ? autre. 
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Les epissages altematifs deja identifies feront I'objet d'une synthese specifique. 
L'hybridation s'effectue a Paide d'une sonde obtenue, par exemple, par retrotranspo- 
sition d!un melange d'ARN provenant de cellules, de tissus ou de liquides biologiques 
provenant de temoins reputes normaux, de membres de populations ethniques diffe- 
5 rentes, de patients atteints de pathologies souvent associees a une expression de retro- 
virus, comme les processus tumoraux, ou comme les maladies auto-immunes, dont la 
sclerose en plaques. Dans ce cas une fraction de fig et jusqu'a quelques jig d' ARNm 
ou jusqu'a quelques \xg ou dizaines de \xg d'ARN, selon la methode utilisee et la taille 
de la puce d'ADN concernee, sont suffisants pour la synthese de la sonde nucleique. 

10 La sonde nucleique est marquee de maniere adequate, afin d'autoriser une detection 
ulterieure, comme par exemple par fluorescence ou par une methode equivalente. 

L'usage de sondes bi-, voire multicolores permet de preciser 
Texpression concertee de plusieurs genes en parallele, en beneficiant de plus d'une 
normalisation precise. L'acquisition des resultats est effectuee automatiquement, 

1 5 comme par exemple par un systeme de balayage laser ou son equivalent. 

Deux types de puces a ADN sont cogues, d'une part des puces 
presentant un ensemble exhaustif de sequences, et d' autre part des puces a ADN speci- 
fiques permettant un ciblage sur une application plus specifique. 

Par exemple, une sequence critique en ce qu'elle contiendrait une 

20 difference portant sur une deletion, voire une mutation, est detectee a Taide 
^oligonucleotides specifiques (Wang et coll., (1998), Science, 280, 1077- 1082). Le 
polymorphisme associe a une base ou a une mutation est detecte a Faide de quatre 
oligonucleotides possedant une des quatre possibilites de sequence au niveau d'une 
base (A, C G ou T): pour chaque difference ponctuelle les 4 oligonucleotides sont 

25 deposes et les intensites d'hybridation sont comparees. De plus, un epissage alterriatif 
est detecte en utilisant des ADN correspondant a un seul exon effectif ou putatif : le 
gene est done analyse exon par exon. Les puces a ADN concernent aussi, par exten- 
sion, toute sequence retrovirale endogene ou exogene, comme par exemple ERV-9, 
ERV-K, ERV-L, ERV-H, ERV-4, ERV-6, ERV-8, ERV-10, ERV-15, ERV-16, ERV- 

30 17, ERV-18, ERV-21, ERV-24, ERV-33, ERV-34, ERV-36, ERV.40, ERV-42, ERV- 
MLN, ERV-FRD, ERV-FTD...), ainsi que toutes les sequences exoniques putatives 
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(identifiees par l'existence de sequences etiquettes et des transcrits corre^ponclants) ou 
effectives, et qui sont situees de part et d'autre jusqu'a une distance de 120 kb des 
sequences retrovirales endogenes de type HERV-7q. 

L'etude comparative est menee entre un echantillon temoin et 
5 T echantillon a tester, dans une perspective prophylactique, diagnostique ou therapeu- 
tique, comme par exemple: la detection precoce d'une modification de I'expression 
d'une des sequences, dans une cellule, un tissu ou un organisme, V identification d'une 
sequence associee a une susceptibilite ou a une pathologic quelconque, Ie suivi de 
revolution de la pathologie, ou encore le suivi d'un traitement et 1'evaluation de son 
10 efficacite. 

En dehors des applications deja enoncees, Tinteret de la methode 
permet, d'une maniere plus generate, de faire un bilan des variations constatees chez 
un individu, ce qui constitue en quelque sorte une carte d'identite, ce qui facilite une 
approche epidemiologique permettant d'etablir de nouvelles correlations entre un 
1 5 profil particulier observe et une pathologie, en dehors de tout a priori concernant cette 
pathologie. 

La presente invention a egalement pour objet un kit de detection 
et/ou d' evaluation d'une maladie auto-immune et notamment des neuropathologies a 
etiologie auto-immune, caracterise en ce qu'il comprend outre les tampons necessaires 
20 a la mise en oeuvre des procedes tels que definis ci-dessus : 

- des reactifs A de diagnostic tels que definis ci-dessus, et 

- des reactifs B constitues par les transcrits et ADNc des sequences 
genomiques, qui codent pour tout ou partie d'un facteur, dont la fonction, la regula- 
tion/deregulation ou I'alteration est associee a Texpression normale ou pathologique 

25 ou a la regulation/deregulation de motifs appartenant a ladite famille HERV-7q, ces 
sequences correspondant a des sequences nucleotidiques codant pour des genes situes 
dans des regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale 
de ladite famille HERV-7q dont Tune des extremites ne peut se trouver a une distance 
excedant 120 kb, \ 

30 lesqueis reactifs sont de preference fixes sur un support approprie. 

Selon un mode de realisation avantageux dudit kit. lesdits reactifs B 
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sont selectionnes dans le groupe constitue par les sequences SEQ ID NQr'62-^7 et 1 19 
et leurs fragments correspondant a un cadre glissant superieur ou egal a 14 nucleotides 
ou leurs^sequences complementaires, ainsi que les sequences representees aux figures 
13-17,22-26. 

5 La presente invention a egalement pour objet des produits de traduc- 

tion, caracterises en ce qu'ils sont codes par une sequence nucleotidique telle que 
definie ci-dessus. 

La presente invention a egalement pour objet un peptide, caracterise 
en ce qu f il est susceptible d'etre exprime a Taide d'une sequence nucleotidique selec- 

10 tionnee dans le groupe constitue par les sequences SEQ ID NO: 1-22, 28 et 61, telles 
que definies ci-dessus, selon les combinaisons offertes par V usage des differents 
cadres de lecture possibles (voir egalement figures 18-21). 

Ledit peptide englobe egalement les peptides ou polypeptides deri- 
ves comprenant entre 5 et 540 aminoacides (SEQ ID NO:23-36 et SEQ ID NO:58 et 

15 leurs fragments d'au moins 5 aminoacides) et notamment un fragment de 538 amino- 
acides, commen9ant a la premiere methionine de la sequence SEQ ID NO:26 (enve- 
rine). 

Selon un mode de realisation avantageux desdits peptides, ils sont 
notamment selectionnes parmi les sequences SEQ ID NO:23-36, 58, notamment la 
20 sequence SEQ ID NO:26 et ses fragments C-terminaux, soit a partir de l'acide amine 
291, soit a partir de l'acide amine 321, a compter de la premiere methionine. 

Selon un autre mode de realisation avantageux desdits peptides, ils 
sont obtenus a partir des sequences nucleiques telles que definies ci-dessus, dans 
Iesquelles au moins un codon non-sens peut etre remplace par un codon codant pour 
25 Tun des aminoacides suivants : Phe (F), Leu (L), Ser (S), Tyr (Y), Cys (C), Trp (W), 
Gin (Q), Arg (R), Lys (K), Glu (E) ou Gly (G). ' ? 

L' invention englobe ainsi les peptides deduits ou les proteines 
deduites correspondant a tout ou partie des sequences nucleiques decrites dans 
T invention, et presentant eventuellement des modifications avec les sequences de refe- 
30 rences decrites dans Tinvention, lorsqu'ils sont exprimes chez certains patients. En 
particulier, Tinvention englobe les sequences completes ou partielles obtenues selon 
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les 3 cadres de lecture sens et les 3 cadres de lecture inverses et complementaires. 
(voir figures 18-21) 

De maniere avantageuse, F analyse de la structure du domaine env de 
HERV-7q, appele enverine, a permis de mettre successivement en evidence: 
5 - un peptide signal N-terminal (region 1- 21) et deux domaines 

transmembranaires (region 320-340; 455-477), responsables d ? interactions avec des 
motifs proteiques ou lipidiques membranaires, 

- un motif immunomodulateur de type CKS-17(Haraguchi et colL, 
(1995), 92, 5568- 5571)/ CKS-25. On peut noter a cet egard, la presence d ? un motif 

1 0 RalD a Finterieur du peptide de type CKS-1 7/CKS-25 de HERV-7q et un motif RvaD 
en position 363 qui correspondent au consensus W/RxxD, propose pour le site actif 
des TGF-P (Huang et aL, J. BioL Chem., 1997, 272, 27155- 27159). de puissants 
facteurs associes a la croissance, a la differentiation et a la morphogenese et qui sont 
associes a de nombreuses pathologies humaines, comme les processus tumoraux 

15 (Tang et coll., (1998), Nat Med., 4, 802- 807) ou les maladies neurodegeneratives 
(Flanders et coll., (1998), Prog. Neurobiol., 54, 71- 85). Les peptides selon Finvention 
contenant ces motifs peuvent avantageusement servir d'antagonistes en inhibant la 
fixation des TGF- p sur leurs recepteurs naturels. 

- des motifs de N-glycosylation. La glycosylation des proteines 
20 d'enveloppe des retrovirus semble etre directement associee a leurs proprietes fonc- 

tionnelles, par exemple en influen9ant le nombre des determinants disponibles dans les 
cellules-T ou en favorisant la reconnaissance des antigenes par les celluIes-T. La 
glycosylation pourrait jouer un role dans la declaration ou Fextension d'une patholo- 
gie a incidence, autoimmune. Les glycosylations sont necessaires au maintien de la 

25 conformation de certains epitopes, en particulier lors de la realisation d'une proteine 
d'enveloppe recombinante a fin de mise au point d'un reactif de"' diagnostic et pour 
favoriser Fefficacite d'un eventuel vaccin. Positions 171, 210, 216, 236, 244, 283 et 
411. Nombre prevu au hasard : 32 

-Ides sites de prenvlation . La prenylation est un mecanisme essentiel 

30 de la fixation a la membrane cellulaire et pour le ciblage de certaines proteines. Ce 
processus de ciblage pourrait etre essentiel pour F elaboration d' agents therapeutiques 
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specifiques aptes a interferer dans la realisation et la regulation du trafic*de complexes 
cellulaires mettant en jeu des proteines impliquees dans les interactions, la croissance 
et les mouvements cellulaires. Positions 188 et 290. Nombre prevu au hasard : 1.8 

- des sites de ciblage dans le reticulum endoplasmique . Ces sites 
5 permettraient d'assurer le ciblage vers le reticulum endoplasmique afin d'effectuer les 
modifications necessaires pour favoriser le franchissement membranaire. Positions 
353 et 431. Nombre prevu au hasard : 0.2. 

Par ailleurs, les Inventeurs ont montre qu'un certain nombre de 
peptides issus de la proteine env de HERV-7q (enverine) presentent une affinite/demi- 
10 vie elevees pour des alleles HLA de classe I. Une analyse par CADD a permis de 
selectionner des peptides candidats, dont les meilleurs scores sont indiques dans le 
Tableau I: 

TABLEAU I 



15 


locali- 


sequence 


molecule HLA 


score 


Sequence n° 






sation 


















399 


FLGEECCYYV 


A-0201 


7214 


SEQ 


ID 


NO: 


68 




462 


LLFGPCIFNL 


A-0201 


1792 


SEQ 


ID 


NO: 


69 


20 


189 


CLPLNFRPYV 


A-0201 


1453 


SEQ 


ID 


NO: 


70 




439 


GLLSQWMPWI 


A-0201 


488 


SEQ 


ID 


NO: 


71 




263 


CLPSGIFFV 


A-0201 


5103 


SEQ 


ID 


NO: 


72 




444 


WMPWILPFL 


A-0201 


897 


SEQ 


ID 


NO: 


73 




252 


IRWVTPPTQI 


B-2705 


3000 


SEQ 


ID 


NO: 


74 


25 


432 


LRNTGPWGLL 


B-2705 


2000 


SEQ 


ID 


-NO: 


75 




158 


LRTHTRLVSL 


B-2705 


2000 


SEQ 


ID 


NO: 


76 




316 


KRVPILPFVI 


B-2705 


1800 


SEQ 


ID 


NO: 


77 




25 


CRCMTSSSPY 


B-2705 


1000 


SEQ 


ID 


NO: 


78 




137 


TRVHGTSSPY 


B-2705 


1000 


SEQ 


ID 


NO: 


79 


30 


124 


AREKHVKEVI 


B-2705 


600 


SEQ 


ID 


NO: 


80 




478 


SRIEAVKLQM 


B-2705 


600 


SEQ 


ID 


NO: 


81 




442 


SQWMPWILPF 


B-2705 


500 


SEQ 


ID 


NO: 


82 




405 


CYYVNQSGI 


Kd 


2400 


_ SEQ 


ID 


NO: 


83 




346 


FYYKLSQEL 


Kd 


2400 


SEQ 


ID 


NO: 


84 


35 


244 


TYTTNSQCI 


Kd 


2400 


SEQ 


ID 


NO: 


85 




291 


SFLVPPMTI 


Kd 


1600 


SEQ 


ID 


NO: 


86 




406 


YYVNQSGIV 


Kd 


1200 


SEQ 


ID 


NO: 


87 




167 


LFNTTIjTGL 


Kd 


1152 


SEQ 


ID 


NO: 


88 




463 


LFGPCIFNL 


Kd 


960 


SEQ 


ID 


NO: 


89 


40 


253 


RWVTPPTQI 


Kd 


480 


SEQ 


ID 


NO: 


90 




449 


LPFLGPLAAI 


B-5102 


2200 


SEQ 


ID 


NO: 


91 




3 


LPYHIFLFTV 


B-5102 


1210 


SEQ 


ID 


NO: 


92 
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TABLEAU I (suited * 

locali- sequence molecule HLA score Sequence n° 

5 sation 





331 


GALGTGIGGI 


B-5102 


798 


SEQ 


ID 


NO: 93 




321 


LPFVIGAGVL 


B-5102 


550 


SEQ 


ID 


NO: 94 




499 


RRPLDRPAS 


B-2705 


600 


SEQ 


ID 


NO: 95 


10 


194 


FRPYVSIPV 


B-2705 


600 


SEQ 


ID 


NO: 96 




383 


RRALDLLTA 


B-2705 


600 


SEQ 


ID 


NO: 97 




39 


WRMQRPGNI 


B-2705 


600 


SEQ 


ID 


NO: 98 




423 


DRIQRRAEEL 


B14 


1800 


SEQ 


ID 


NO: 99 




158 


LRTHTRLVSL 


B14 


600 


SEQ 


ID 


NO: 100 


15 


359 


ERVADSLVTL 


B14 


540 


SEQ 


ID 


NO: 101 




463 


LFGPCIFNLL 


Kd 


1658 


SEQ 


ID 


NO: 102 




345 


QFYYKLSQEL 


Kd 


1152 


SEQ 


ID 


NO: 103 




443 


QWMPWILPFL 


Kd 


691 


SEQ 


ID 


NO : 104 




405 


CYYVNQSGIV 


Kd 


500 


SEQ 


ID 


NO: 105 


20 


474 


NFVSSRIEAV 


Kd 


480 


SEQ 


ID 


NO: 106 




221 


GPLVSNLEI 


B-5102 


1320 


SEQ 


ID 


NO:107 




190 


LPLNFRPYV 


B-5102 


726 


SEQ 


ID 


NO: 108 




449 


LPFLGPLAAI 


B-5101 


1144 


SEQ 


ID 


NO: 109 




488 


EPKMQSKTKI 


B-5101 


968 


SEQ 


ID 


NO: 110 


25 


3 


LPYHIFLFTV 


B-5101 


629 


SEQ 


ID 


NO:lll 




125 


REKHVKEVI 


Kk 


1000 


SEQ 


ID 


NO: 112 




312 


KPRNKRVPIL 


B7 


800 


SEQ 


ID 


NO: 113 




378 


WLQNRRAL 


Db 


792 


SEQ 


ID 


NO: 114 




377 


AWLQNRRAL 


Db 


660 


SEQ 


ID 


NO: 115 


30 


321 


LPFVIGAGV 


B-5101 


629 


SEQ 


ID 


NO: 116 




304 


DLYSYVISK 


A3 


540 


SEQ 


ID 


NO: 117 




301 


TEQDLYSYVI 


Kk 


500 


SEQ 


ID 


NO: 118 



Ce Tableau I indique une estimation de la demi-vie de dissociation 
35 d'un peptide de Penverine avec un allele du systeme HLA de classe I (les tables de 
coefficients de Parker: J. Immunol, (1994), 152, 163- 175). La localisation indique la 
position du premier acide amine des peptides testes dans la sequence de Penverine. Le 
code a une lettre est utilise pour la sequence des acides amines. Les scores autour de 
500 ou superieurs a 500 ont ete retenus. A titre de comparaison^ une analyse a ete 
40 effectuee sur une concatenation de peptides (polypeptide de 4968 acides amines) 
reputes pour fixer les molecules du complexe majeur d'histocompatibilite de classe 1 
(Rammensee, Immiinogenetics, (1995), 41, 178- 228): les dix meilleurs scores enre- 
gistres pour des nonapeptides et le type HLA, A_0201 sont respectivement de 4984, 
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4047, 2406, 1267, 800, 705, 607, 591, 591 et 577. ^ 

II ressort de ce Tableau I que certaines molecules du complexe 
majeur d' histocompatibility de type I sont aptes a fixer des peptides issus de 
Penverine, ainsi assimiles a des peptides d'origine virale ou tumorale, au niveau du 
5 reticulum endoplasmique. Les complexes formes au niveau du reticulum endo- 
plasmique sont alors transports a la surface cellulaire, ce qui entraine la destruction 
de la cellule cible par les lymphocytes-T cytotoxiques. Les peptides identifies 
comportent generalement 8 a 10 acides amines. Des etudes ont montre que certains 
alleles du systeme HLA de classe I sont ainsi associees a certaines pathologies, en 

10 particulier a caractere auto-immun, comme HLA-B27 avec la spondylarthrite ankylo- 
sante ou HLA-B5 1 avec la maladie de Behcet. 

Un peptide apte a fixer une molecule particuliere de classe I est par 
consequent apte a fonctionner comme un epitope de cellule-T. 

En consequence, la presente invention inclut egalement les 

15 fragments 399-471 et 244-271 de Fenverine qui regroupent avantageusement plusieurs 
epitopes de forte affinite pour differents haplotypes du systeme HLA de classe I. 
L'usage de tout ou partie de ces polypeptides est en consequence apte a favoriser ime 
augmentation du repertoire des cellules-T, en permettant une meilleure efficacite de la 
reponse immunitaire dans le cadre des differentes strategies immunotherapeutiques, 

20 prophylactique ou vaccinales). Ces peptides pourront etre avantageusement delivres 
par exemple par l'usage, de vecteurs viraux, de particules virales ou synthetiques, de 
lipopeptides, d'adjuvants classiques, d' acides nucleiques nus ou adsorbes sur des 
particules, ou de liposomes. 

Au sens de la presente invention, les peptides peuvent etre chimi- 

25 quement ou biochimiquement modifies ; certaines des acides amines peuvent etre 
remplaces par un acide amine analogue, selon les criteres classiques d'homologies (A 
ou G ; S ou T ; I, L ou V ; F, Y ou W ; N ou Q ; D ou E). 

La presente invention a egalement pour objet des compositions 
immunogenes ou vaccinales, pour la protection contre les maladies auto-immunes, 

30 notamment chez les sujets a risque, caracterisee en ce qu'elle comprend au moins un 
peptide comprenant au moins un motif de type CKS et/ou au moins un peptide 
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constitue par un motif presentant une affinite avec Tun des haplotypqs du%ysteme 
HLA de classe I ou de classe II et un vehicule pharmaceutiquement acceptable! 

Selon un mode de realisation avantageux de Iadite composition, ledit 
motif est selectionne dans le groupe constitue par les peptides tels que definis dans le 
5 Tableau I ci-dessus. 

Selon un autre mode de realisation avantageux de ladite composi- 
tion, ledit peptide presente la sequence suivante : 

sequence CKH: LONRRALDLLTAERGGT clFLGEECCYYV 
(SEQIDNO:120). 

10 II est remarquable de constater au niveau de la position 380 de la 

proteine enverine, la contigui'te des motifs de type CKS-17 (souligne) et du peptide 
presentant le score le plus eleve (en gras ; voir peptide en position 399 dans le Tableau 
I, SEQ ID NO:68) dans la sequence CKH. 

L'activation clonale des sous-groupes de lymphocytes, par exemple 

15 de lymphocytes cytotoxiques, par les peptides du Tableau I et par extension leurs 
homologues, est bloquee par des manoeuvres usuelles d'immunotherapie comme par 
exemple la serotherapie et la vaccination. 

I/association de deux sequences ou des sequences analogues au 
peptide CKH (SEQ ID NO:120), est a meme d'entrainer un processus synergique dans 

20 la reponse immunitaire, qui pourrait mettre en jeu des voies de signalisation et 
deactivation complementaires, aptes a moduler Factivation lymphocytaire. 

La vaccination concerne la production d'anticorps diriges contre les 
peptides du tableau I, selon les regies de Tart et selon les methodes de liberation 
controlees par implants artificiels ou cellulaires mettant en oeuvre une composition 

25 telle que definie ci-dessus et par usage des manoeuvres de therapie genique, comme 
par exemple par expression des sequences nucleiques codant polir les peptides du 
Tableau I. En consequence Finvention a egalement pour objet des compositions 
immunogenes ou vaccinale caracterisee en ce qu'elles comprennent un vecteur 
incluant au moins une sequence nucleique codant un peptide tel que defini dans le 

30 Tableau I, eventuellement associee a une sequence codant un motif de type CKS-17. 

La serotherapie concerne Futilisation d'anticorps neutralisants 
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produits a partir des peptides du Tableau I et leurs homologues. ^ y 

Les produits proteiques generes par les sequences retrovirafes endo- 
genes ou produits parallelement peuvent avantageusement etre caracterises par des 
micro-methodes d'analyse et de quantification des peptides et des proteines: 
5 HPLC/FPLC ou equivalent, electrophorese capillaire ou equivalent, techniques de 
microsequen9ages (methode d'Edman ou equivalent spectrometrie de masse...)- 

L'invention a egalement pour objet des anticorps diriges contre Tun 
ou plusieurs des peptides decrits ci-dessus et leur utilisation soit pour la mise en ceuvre 
d'une methode de detection in vitro, notamment differentielle de la presence d'une 
10 telle sequence chez un individu, soit pour la preparation d'une composition apte a etre 
utilisee en serotherapie dans les neuropathologies a composante auto-immune. 

Lesdits anticorps sont avantageusement des anticorps polyclonaux 
ou monoclonaux obtenus par une reaction immunologique d'un organisme humain, 
mammiferes, oiseaux ou autres especes vis-a-vis des proteines, telles que definies ci- 
15 dessus. 

La presente invention a pour objet un procede de depistage 
immunologique differentiel de sequences retrovirales endogenes humaines de la 
famille HERV-7q normales ou pathologiques, caracterise en ce qu'il comprend la mise 
en contact d'un echantillon biologique avec un anticorps selon l'invention, la lecture 
20 du resultat etant revelee par un moyen approprie, notamment EIA, ELISA, RIA, 
fluorescence. 

A titre d' illustration, une telle methode de diagnostic in vitro selon 
l'invention comprend la mise en contact d'un echantillon biologique preleve chez un 
patient, avec des anticorps selon l'invention et la detection a 1'aide de tout procede 
25 approprie, notamment a I'aide d'anti-immunoglobulines marquee, des complexes 
immunologiques formes entre les proteines produites normalement ou pathologique- 
ment et les anticorps. 

Des anticorps monoclonaux ou polyclonaux, produits a partir 
d'antigenes correspondants a des peptides de synthese, de polypeptide ou proteines 
30 recombinants, permettent de suivre l'expression des peptides ou proteines produits 
normalement ou pathologiquement. L'analyse est de preference effectuee par ELISA, 



WO 99/67395 ^ / PCT/FR99/01513 

34 

ou equivalent, Western-blot ou equivalent, ou par immunohistochimie. \ 

Les peptides ou proteines, issus des sequences retrovirales endo- 
genes ou dont l'expression est associee a l'expression de ces sequences retrovirales 
endogenes, sont recherches et identifies. 
5 La presente invention a egalement pour objet un procede d'identifi- 

cation et de detection de motifs retroviraux endogenes, anormalement exprimes dans 
le cadre de pathologies associees au cancer, ou de neuropathologies en particulier 
auto-immunes, au premier rang desquelles la sclerose en plaques, caracterise en ce 
qu ? il comprend Tanalyse comparee des sequences extraites d ! un echantillon biologique 

10 avec les sequences selon Tinvention. 

La presente invention a egalement pour objet 1'application des 
sequences nucleiques ou des sequences proteiques selon Tinvention au diagnostic, au 
pronostic, a revaluation de la susceptibilite genetique, a toutes maladies humaines 
induites, innees ou acquises en particulier celles a composantes cancereuses, auto- 

15 immunes et/ou a incidence neurologique, comme la sclerose en plaques, les 
syndromes associes et les maladies neurodegeneratives ou intervient tout ou partie des 
sequences nucleiques selon Finvention et des formes endogenes ou exogenes appa- 
rentees. 

La presente invention a egalement pour objet des sequences 
20 nucleiques hybrides, caracterisees en ce qu'elles comprennent des sequences ou motifs 
nucleiques selon Tinvention, combines avec des sequences ou motifs d'origine endo- 
gene ou d*origine ou induits de maniere exogene. 

La presente invention a, en outre, pour objet un vecteur recombinant 
de clonage ou depression, caracterise en ce qu'il comprend une sequence nucleique 
25 conforme a Finvention. 

Des manoeuvres therapeutiques peuvent etre envisagees par usage de 
certaines des sequences nucleiques contenues dans HERV-7q et les sequences de la 
meme femille ou des structures polypeptidiques.deduites ou par utilisation de peptides 
ou proteines, ou d'anticorps specifiques. 
30 Conformement a Tinvention, tout ou partie des sequences nucleiques 

retrovirales endogenes de type HERV-7q, peut etre utilisee a usage de vecteur ou 
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d'elements de vecteurs a vocation therapeutique, en particulier les sequences i!tR et la 

region gag (SEQ ID NO :2, 2 1 et 22). . 

L'interet de telles sequences reside, dans Finnocuite du vecteur ainsi 

forme, dans la possibility d'une insertion specifique ciblee dans une region bien defi- 
5 nie par nne strategic analogue a la recombinaison homologue, dans le ciblage cellu- 

laire, eventuellement transitoire dans le cas d'une expression placentaire chez la 

femme. Un autre aspect concerne la possibility d'associer aux genes d'interets les 

motifs retroviraux biologiquement actifs (peptides immunomodulateurs, tels que 

representes aux sequences SEQ ID NO 68-1 18, ci-apres, peptide fusogene...)> 
10 La presente invention a egalement pour objet des animaux 

transgeniques, caracterises en ce qu'ils comprennent tout ou partie d'une sequence de 

type HERV-7q (SEQ ID NO:l-22 et 61). 

Le Tableau II ci-apres etablit les correspondances entre les numeros 

des sequences telles qu'elles apparaissent dans la liste de sequences et le nom des 
1 5 differentes sequences. 

TABLEAU II 



SEQ ID NO : 


DESIGNATION 


1 


Acide nucleique : 7 env 


2 


Acide nucleique : gag 


3 


Acide nucleique : HERV-7q 


4 


Acide nucleique : HE2 


5 


Acide nucleique : HE3 


6 


Acide nucleique : HG3 


7 


Acide nucleique : HE4 


8 


Acide nucleique : HE5 


9 


Acide nucleique : HE6 


10 


Acide nucleique : HG6 


11 


Acide nucleique : HE7 


12 


Acide nucleique : HE8 " 7 


13 


Acide nucleique : HG8 


14 


Acide nucleique : HE9 


15 


Acide nucleique : HE 10 


16 


Acide nucleique : HE1 1 


17 


Acide nucleique : HG1 1 


18 


Acide nucleique : HE 12 


19 


Acide nucleique : HG12 



WO 99/67395 / 



.-■--'-) Y 

WO 99/67395 J PCT/FR99/01513 



36 



SEO ID NO- 






/\CXUC I1UC1CKJUC . XV 1 


Zl 


/\ciae nucieique . ivir 


ZZ 


/\C1UC IlUClCiqiXC > prOlClllC CilV UCUUIIC . rXCIV V - / 1| 


21 


iXagXXXCXll UC piUlCUXC C11V UCUUIIC dClUIi OOV^f 1-L' 1N\_/ 


Zt 


rragiiiciii uc proicinc cnv ucuuiic scion o-cv^ ^j-^ iNvy „zz 


z.j 


Pro o"m f*x\ t Hf* rvrAtfMnf* Anv Hf^rlintf* cp>| r\r\ QPO TT*i *79 
FiaglllCllL UC piUlCXXIC CXXV UCUUIIC 5C1UI1 OL<y ILs IN w 




I lUlCliXC . CllVCJlilXC 


z / 


rragincni uc proicinc cnv ucuuiic scion oEy iiv inw .zz 


zo 


/A.C1UC IlUClCiqilC ' prULCIiiC UCUUILC UC gag . ij.x_^iv V - / q 


?Q 
&y 


rragincni uc pruicmc gag ucuuiic scion ocy IjL/ in w .zo 


j\J 


rragmeni ae proicinc gag acouiic scion oc\i ili \S\J .zo 




rragrncni ae proicinc gag ucuuiic scion oilv^/ il/ in w .zo 


JZ 


Fiaguiciii uc proicinc gag ucuuiic ocion on>\^ iu rvvj .zo 




FraglllCIll UC prOlCHlC gag UCUUIIC oClOIl OILv^ LU IN vy .zo 


14 


rragiiiciii uc proicinc gag ucuuiic scion oi_/V</ iiv in w .zo 


15 


rroicinc cnv . caurc uc lcciurc i 


16 


i 101C1I1C gag 


17 


rvClUC I1UC/1C1C|UC . vJir ^alllOrL-C/ 


1R 

JO 


AtluC I1UC1C11|UC . \J 1 IV ^aiiiorwc j 


1Q 


rlLIUC 11UU1C11|uC . vJZP ^al I lOrCC J 


40 


Api/1p mirlptnup * /~10 / orT^r\T*r»^» > \ 

/\ciuc nuuiciijuc . vjzxv ^ainurcc ) 


41 


rVLlUC IlUL/lClLJUC . VJH-r ^alTlOrCC^ 


4? 

*tZ 


/A.C1UC iiUL/iciiiuc . vjjr ^aiiiorcc^ 


41 


/\ciuc iiuLiciijuc . vj^riv ^ainoruc ^ 


44 


/\wiuc iiunciLjuc . vj jiv ^amorce; 


4S 


/\ciuc nuciciquc . Eir ^amorce ^ 


46 


/-vciuc nuciciquc . ni iv ^amorce ) 


47 


rvLlUC nuClCll|Uc . JDZP ^alTlOrCc } 


Ho 


/\ciac nuciciquc . nzrv ^amorce ) 


40 


A /^l/lp nil/^lA1A11P * ^ /" ntv^ Ar/>o\ 

/\ciuc nucieicjuc . xijr ^aniorcc ) 


SO 


/\ciuc iiuciciLjuc . jZrJxv ^diriorccj 


51 


rvi/iuc nuclei que . es+t ^ainorcc ) 


5? 

*/Z 


/\wiuc nuciciquc . x^t-iv ^ainorcc ^ 




/\liuc nuclei que . ^amorce j 


54 


awiuw xiudciquc • ijrUX ^axxxux uc j y 


55 


rVLlU^ XXUUlCXUliC • XJ^/JV tdXXlL/XL'Cf 


56 


atlUC IXU^/XCiqUC . X_>AJ- ^aillOi UC ^ 


57 


Acide nucleiaue • KxR ( amorce i 


58 


Proteine gag 


59 


Acide nucleique : Sequence A (sequence d'insertion) 


60 


Acide nucleique : Sequence B (sequence d' insertion) 


61 


Acide nucleique : HE 13 


62 


Acide nucleique : RH7 
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SFO ID NO- 




UH.olVjrl^/\ X 




A f»i c\c* rmi**1*iinn^ 
/A.L-1UC IlUdCllJUC 


. IvrMVl / J 


64 
u*t 


/\W1UC UUClCiqUC 


t\J\ V / J 


6S 


/\ciae nucieicjue 


IvDr J «- 


oo 


/\ciae nuclei que 


till 


67 
0 / 


ACluc nuClclqUc 


T TV 

Lrl A 


6ft 
05 


rCpllQc 1 aDlcaU J 




60 


r epuae i aoieau j 




1(\ 

/u 


r epuae i aoieau j 




71 


r epuae i aoieau j 




7? 


r epuae i aoieau j 




7^ 


r epuae x aoieau j 




1A 
/ i 


r epuae x aoieau j 




7<\ 


r epuae l aoieau j 




76 
/O 


r epuae i aoieau j 




77 


Peptide Tableau ] 




7fi 


r epuae l aoieau j 




70 


r epuae i aoieau i 




OU 


r epuae i aoieau j 




O 1 


x epuue l aoieau i 






i epuue X aoieau J 




oj 


r epLlUC X aDXCaU J 




RA 


r epuue x aoieau 1 




5K 


r epuae x aoieau i 




86 
oo 


x epuae x aoieau x 




B7 
5/ 


r epuae x aoieau i 




oo 


r epuae x aoieau i 




SO 

oy 


r epuae x aoieau x 




on 


r epuae x aoieau i 




01 


r epuae x aoieau 1 




00 


r epuae i aoieau i 




0^ 

yj 


r epuae x aoieau i 




OA 

7H 


r epuae i aoieau 1 




0<\ 


r epuae x aoieau x 




06 


r epuae x aoieau 1 




07 

y i 


r epuue x aoieau 1 




OR 

"O 


r epuue x aoieau x 




00 


x epuue x aoieau x 




100 


Peptide Tableau I 




101 


Peptide Tableau I 




102 


Peptide Tableau I 




103 


Peptide Tableau I 




104 


Peptide Tableau I 




105 


Peptide Tableau I 
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106 


Pf*ntiHp* TaHlpan T ~ 


SEO ID NO* 




107 

— 1 V / 


r CpilUC 1 aUlCau X 


10R 


i cpilUC 1 a Died U 1 


100 


r CpilUC 1 aDICau 1 


1 10 


i CpilUC 1 dDlCaU X 


1 1 1 

ill 


r CpiIUe 1 aDICaU 1 


LIZ, 


rcpuue i auieau i 


1 11 


r cpilU-C 1 aUXCaU I 


114 


r epiiae I aoieau i 


1 1S 


r CpLlUC 1 aDICaU 1 


1 16 


r cpuuc I dUlCdU I 


117 


Pentide Tableau T 


118 


Peptide Tableau I 


119 


Acide nucleique : BLIMP- 1 


120 


Peptide : CKH 


121 


Acide nucleique : F645 (amorce) 


122 


Acide nucleique : PS5D (amorce) 



Outre les dispositions qui precedent, 1' invention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en ceuvre du procede objet de la presente invention ainsi qu'aux 
5 dessins annexes, dans lesquels : 

- Figure 1. Sequence nucleique humaine HERV-7q, dont Tanalyse et 
le traitement permettent de caracteriser une nouvelle structure retrovirale endogene. 
Les regions nucleiques repetees de type Rl et R2 et les domaines gag, pol et env sont 
soulignes. Les domaine de type gag et env sont en italiques. La region homologue a 

10 une partie 3' non-codante de Rab? est doublement soulignee. 

- Figure 2. Cartographie de la region retrovirale endogene humaine 
HERV-7q. La partie haute de la figure correspond a une region anonyme du genome 
humain situee sur le bras long du chromosome 7. On peut identifier les domaines 
repetes (1), gag (2), pol (3) et env (4) de HERV-7q. La region env C-terminale (4.3) se 

15 prolonge en amont en un long cadre de lecture ouvert (4.2). Le domaine 4.1, corres- 
pond a la region N-terminale du domaine env. 

- Figure 3. Comparaison des sequences nucleiques repetees situees 
aux bornes de HERV-7q. Les regions nucleiques repetees 5'(haut) et 3'(bas), sont 
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comparees et les bases identiques sont indiquees par deux points. * 

- Figure 4. Sequence deduite presentant un cadre de lecture ouvert, 
dans le domaine de type-env de HERV-7q selon la regie du plus long cadre de lecture 
ouvert. 

5 - Figure 5. Sequences autour du domaine CKS-17 identifiees dans 

differents domaines env deduits de la famille de HERV-7q et comparaison avec des 
motifs CKS-17 de reference. 

1) HE2 - 2) HERV-7q - 3) N° d'acces a GenBank: M85205 - 4) 
HE7 - 5) HE9 - 6) CKS-17: le motif peptidique doue de proprietes immunomodula- 
1 0 trices est souligne - 7) gp20 de retrovirus de type-D (SRV-Pc). 

- Figure 6. Sequence deduite possible du domaine de type-gag iden- 
tifie dans HERV-7q etablie selon la regie du plus long cadre de lecture ouvert. X et / 
correspondent respectivement a un codon non-sens et a un decalage de cadre de 
lecture. La sequence soulignee correspond au debut du domaine pol 

15 - Figure 7. Comparaison des regions nucleiques couvrant la region 

gag de HERV-7q (haut) et HERV-TcR (bas) et leurs regions flanquantes. Les bases 
identiques sont specifiees par deux points. 

- Figure 8. Exemple d'alignements nucleiques du domaine de type 
env de HERV-7q avec des domaines de type env similaires presents dans des 

20 sequences retrovirales endogenes humaines de la raeme famille. Les codons non sens 
sont soulignes : 1 ) HERV-7q - 2) HE2 - 03) HE3 - 04) HE4. 

- Figure 9. Alignements nucleiques entre le domaine gag de HERV- 
7q et les domaines correspondants appartenant a la meme famille. Comparaison avec 
des fragments de domaines gag isoles d'agents retroviraux infectieux. Sequences 

25 d'origine retrovirale infectieuse: N° d'accession dans la banque de donnees EMBL : 
1 ) A60168 - 2) A60201 - 3) A60200 - 4) A6017L Sequences retrovirales endogenes 
humaines: 5) HERV-7q - 6) HG1 1 - 7) HG3. Les chiffres indiques dans les sequences 
endogenes, correspondent au nombre de nucleotides inseres afin d'optimiser 
Talignement avec les sequences de type gag identifiees dans des retrovirus d'origine 

30 infectieuse. 

- Figure 10. Alignement d'un motif gag proteique deduit (haut) 
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appartenant a un retrovirus infectieux (N° d'accession EMBL : A6020Oiavec le motif 
gag proteique deduit (bas) identifie dans HERV-7q. Les codons non-sens sont en gras 
et soulignes. Les acides amines identiques sont specifies par 2 tirets. Un tiret indique 
une deletion ou un acide amine homologue. 
5 - Figure 11. Alignement d'un motif env (haut) appartenant a un 

retrovirus infectieux (N° d'accession EMBL : A60170) avec le motif env (bas) identi- 
fie dans HERV-7q. Les nucleotides homologues sont specifies par deux points et les 
deletions par un tiret. 

- Figure 12. Comparaison entre le domaine env de HERV-7q (haut) 
10 et le domaine env de HERV-9 (bas). L'homologie de 66 % se limite a la region 3' du 

domaine env de HERV-7q et HERV-9, respectivement entre les nucleotides 8976 nt et 
9500 nt de HERV-7q et les nucleotides 2898 nt et 3465 nt de HERV-9 (N° 
d'accession a GenBank : X57147). De nombreuses insertions/deletions sont aussi 
observees. 

15 - Figure 13. Homologie entre une partie de la sequence du transcrit 

codant pour RH7 (haut, SEQ ID NO:62) et un motif de RGH2 (bas - N° d'accession a 
GenBank: Dl 101 8). 

- Figure 14. Identification de la sequence du transcrit codant pour 
RAM75 (SEQ ID NO:63), correspondant au gene d'une ATPase de type PEX1. Les 

20 exons codants sont soulignes. Les codons d' initiation et non-sens ainsi que les sites 
putatifs de polyadenylation sont en gras et soulignes. La region en italique correspond 
au debut de la sequence retroviral endogene RH7. 

- Figure 15. Sequence du transcrit codant pour RAV73 (SEQ ID 
NO:64), situee a 0.7 kb en aval de HERV-7q ; les sequences nucleiques aptes a coder 

25 pour un ou plusieurs polypeptides sont soulignees. 

- Figure 16. Comparaison entre la sequence T LTR 3' (haut) de 
HERV-7q et la sequence intronique LTX (SEQ ID NO:67), situee dans le gene FMR2, 
associe au X-fre^ile (bas). 

-i Figure 17. Mise en evidence de modifications sur la sequence 
30 nucleotidique (ID NO:3), chez des patients atteints de SEP. Les bases modifiees, chez 
au moins un patient, sont soulignees. Les amorces utilisees sont en italiques 
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(sequences SEQ ID NO: 121 et 122). L'ATG d'initiation et le codon noa-sens sont en 
gras. - - . 

- Figure 18. Partie codante env de la sequence HERV-7q (sequence 
ID NO:3), avec 3 cadres de lecture. 

5 - Figures 19, 20, 21. Presentation separee de la proteine env selon les 

3 cadres de lecture. 

- Figure 22. Sequence nucleique contenant la sequence retro virale 
RH7 situee en 5' de la sequence HERV-7q. La sequence en italique correspond au 
debut de la sequence HERV-7q. La sequence RH7 est soulignee. Deux sites de poly- 

1 0 adenylation putatifs sont gras. 

- Figure 23. Sequence du transcrit codant pour RBP3 contenant des 
motifs nucleotidiques identifies dans la sequence nucleique codant pour le gene 
BIimp-1. 

- Figure 24. Sequence du transcrit codant pour APS. 

15 - Figure 25. Sequence du transcrit codant pour Blimp-1 ; la partie 

codante est soulignee ; les codons d'initiation et de terminaison sont en gras. 

- Figure 26. Sequence du transcrit codant pour FMR2. La partie 
codante est soulignee. Les codoris d'initiation et non-sens sont en gras. 

II doit etre bien entendu, toutefois, que ces exemples sont donnes 
20 uniquement a titre d'illustration de Tobjet de Tinvention, dont ils ne constituent en 
aucune maniere une limitation. 

EXEMPLE 1 : Detection, par amplification genique, d'une sequence nucleique 
appartenant a un domaine de type gag ou env selon Tinvention, dans un echan- 
tillon d'ADN genomique d'origine humaine ou de mammiferes. 

25 L'amplification genique s'effectue a partir d'ADN genomique isole 

a partir du sang. Un traitement anticoagulant est effectue avec 1 ml d'une solution de 
citrate (pour un litre : 4,8 g de d'acide citrique, 13,2 g de citrate de sodium, 14,7 g de 
glucose) pour 6 ml de sang firais. Apres centrifugation de 20 ml de sang pendant 15 
mn a 13.0000 g 9 leisurnageant est elimine et la fraction enrichie en globules blancs est 
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transferee dans un nouveau tube, puis recentrifugee dans les memes^onaitions que 
precedemment. La fraction enrichie en globules blancs est resuspendue dans un 
tampon d'extraction (10 nm Tris-HCl, 0,1 M EDTA, 20 ^ig/ml de RNAse pancreatique 
traitee afin d'eliminer les DNAses. 0,5 % SDS, pH 8,0), puis incubee pendant 1 heure 
5 a 37°C. La proteinase K est ajoutee a une concentration finale de 100 jig/ml. La 
suspension des cellules lysees est incubee a 50°C durant 3 heures sous agitation perio- 
dique, puis traitee par un volume egal de phenol equilibre par du Tris-HCl 0,5 M, pH 
8,0. L'emulsion formee est placee sur une roue pendant une heure, puis centrifugee a 
5000 g pendant 15 mn a temperature ambiante. La solution aqueuse est traitee depro- 

10 teinise par une triple extraction phenolique afin d'obtenir un niveau de purification 
correspondant a un rapport final d'absorbance A260/A280 superieur a 1.75. La frac- 
tion aqueuse est precipitee par 0,2 vol. d'acetate de sodium 10 M et 2 vol. d'ethanol. 
L'ADN est alors soit preleve avec Textremite d'une pipette pasteur recourbee, soit 
centrifuge a 5000 g pendant 5 mn a temperature ambiante. L'ADN ou le culot d'ADN 

15 est lave deux fois par de Tethanol a 70 %, puis repris dans 1 ml de TE pH 8,0 afin 
d'etre elue sous agitation douce pendant 12 a 24 heures. 

Des oligonucleotides specifiques des sequences endogenes decrites 
selon T invention sont choisis pour amplifier la region gag ou env des regions retro- 
virales endogenes decrites selon Tinvention. L'ADN genomique etudie provient de 

20 patients presentant des pathologies comme la sclerose en plaques et d'individus repu- 
tes sains. 

Les ADN polymerases thermostables utilisees ont ete choisies pour 
leur grande fidelite Iors du processus d'amplification, comme la Vent, ADN polyme- 
rase (Biolabs) ou equivalent, et sont utilisees selon les conditions preconisees par le 
25 fournisseur. 

La strategie d'amplification utilise selon les cas^une simple PCR, ou 
une PCR nichee ou semi-nichee. 

Oligonucleotides utilises pour amplifier la region gag : 
r amorce GIF, sens, localisee dans la region amont du domaine gag 
30 de HERV-lq (SEQ ID NO:37), 

- amorce G1R, anti-sens, localisee dans la region 3' terminale du 
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domaine gag (SEQ ID NO:38), \ ? 

Le fragment de 1505 nt amplifie par le couple G1F-G1R : 1505 nt 
est utilise afin de generer les sondes aptes a hybrider les differents produits 
d'amplification des PCR. 
5 - amorce G2F, sens nichee (SEQ ID NO:39), 

- amorce G2R, anti-sens nichee (SEQ ID NO:40),. 

- amorce G4F, sens nichee (SEQ ID NO:41), 

- amorce G3F, sens nichee (SEQ ID NO:42). 

- amorce G4R, anti-sens nichee (SEQ ID NO:43), 
1 0 - amorce G5R, anti-sens nichee (SEQ ID NO:44), 

Oligonucleotides utilises pour amplifier la region env de HERV-7q : 

- amorce E1F, sens (SEQ ID NO:45), 

- amorce E1R, anti-sens (SEQ ID NO:46), 

Le fragment de 2529 nt amplifie par le couple d'amorces E1F-EIR, 
15 est utilise afin de generer les sondes aptes a hybrider les differents produits 
d' amplification des PCR. 

- amorce E2F, sens (SEQ ID NO:47), 

- amorce E2R, antisens (SEQ ID NO:48), 

- amorce E3F, sens (SEQ ID NO:49), 

20 - amorce E3R, anti-sens (SEQ ID NO:50), 

- amorce E4F, sens (SEQ ID NO:5 1 ), 

- amorce E4R, anti-sens (SEQ ID NO:52), 

- amorce E5F, sens (SEQ ID NO:53), 

- amorce E6F, sens(SEQ ID NO:54) 
25 - amorce E5R(SEQ ID NO:55). 

- amorce ExF (SEQ ID NO:56) " 7 

- amorce ExR (SEQ ID NO:57) 

La PCR est realisee a partir de 50 a 200 ng d'ADN genomique. Les 
conditions de PCR sont celles preconisees par le fournisseur. Les conditions cycliques 
30 d' amplification sont realisees dans 50 ul : une denaturation de 94°C pendant 1 min., 
. une hybridation de 70°C pendant 1 min., et une elongation a 72 °C pendant 1 a 2 min., 
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selon les fragments amplifies. Apres 35 cycles, une reaction terminate est menee a 
72°C pendant 10 min. Le sequen9age automatique des echantillons amplifies est rea- 
lise a Uaide d'un sequenceur Applied Biosystems.de type ABI 377 ou autre modele 
comparable, selon les protocoles fournis par le constructeur. 
5 Dans le cas d'une PCR nichee ou semi-nichee, les memes conditions 

experimentales sont utilisees, a la seule difference que fechantillon d'ADN geno- 
mique est remplace par 5 a 10 \l\ du produit d'amplification issu de la premiere PCR. 

Deux amplifications independantes sont realisees a partir du meme 
echantillon. Une reaction de controle est realisee en rempla9ant fechantillon d'ADN 
10 par de I'eau afm de detecter d'eventuels contaminants. 

EXEMPLE 2 : Detection par amplification genique d'une sequence nucleique 
selon Pinvention dans un echantillon biologique d'ADN genomique preleve chez 
des patients presentant une pathologie candidate declaree ou la suspicion de cette 
pathologic 

15 Le protocole d'amplification est le meme que dans I'exemple L mis 

a part forigine de fechantillon qui provient de patients presentant une pathologie 
candidate. Un echantillon d'ADN genomique repute normal est systematiquement 
integre dans V ensemble des echantillons pathologiques amplifies puis analyses. 

Les produits de PCR sont separes sur un gel d'agarose a 1,5 %, puis 

20 transferes en presence de soude 0,4 N sur une membrane de nylon charge. Une hybri- 
dation est realisee avec une sonde specifique correspondant aux fragments de PCR 
amplifies soit par les couples G1F-G1R soit par le couple E1F-E1R. La sonde est 
marquee par incorporation de dUTP-digoxygenine selon le protocole du fournisseur 
(Boehringer Mannheim). L'hybridation est effectuee dans un tampon d'hybridation 

25 (5XSSC, 50 % formamide, 0,1 % lauroyl-sarcosine, 0,02 % SDS ? 2 % de reactif de 
blocage Boehringer) pendant une nuit a 42°C. Le Southern est lave 2 fois 5 min. a 
temperature ambiante dans une solution.de 2XSSC, 0,1% SDS. Puis un lavage a haute 
stringence est effectue a deux reprises pendant 15 min. a 55°C dans une solution 
0,1XSSC, 0,1 % £>DS. L'hybridation est revelee selon le protocole du fournisseur 

30 (Boehringer Mannheim), en presence d'un substrat chimioluminescent de la phospha- 
tase alcaline, de type CSPD ou CDP-STAR. Le filtre est revele apres une exposition 
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de 15min. a60min. * 

Une analyse par SSCP (" single strand conformation polymor- 
phism ") permet de detecter des modifications discretes de la sequence des fragments 
amplifies par PGR. La PCR est menee en presence de dCTP marques au P 32 . L'echan- 
5 tillon a analyser est denature a 95°C pendant 10 min., en presence de tampon de 
charge, puis immediatement charge sur un gel de polyacrylamide a 10%, contenant 
7.5% de glycerol. La migration s'effectue a 4°C a 8-10 W. Le gel est seche puis auto- 
radiographic. 

Les fragments de PCR susceptibles de presenter une alteration de 
10 leur sequence nucleotidique sont sequences selon Fexemple 1 . 

Une hybridation a Faide d'un oligonucleotide specifique (17 mers a 
20 mers) correspondant a la region nucleotidique modifiee permet d'identifier les 
echantillons presentant une modification identique (methode ASO). Brievement le 
v southern est hybride avec un oligonucleotide marque distalement soit au P 32 , soit en 
15 presence de digoxygenine (selon le protocole de Boehringer Mannheim) puis lave 
dans des conditions stringentes a 65%C dans une solution 6XSSC, 0.05% pyrophos- 
phate de sodium. 

Par exemple, un sequen9age nucleotidique automatique a ete realise 
sur six fragments de PCR, provenant de 5 patients atteints de SEP et un temoin repute 

20 normal, et qui ont ete amplifies a partir des amorces F645: 
CTTCAAACAACAACCAGGAGG (SEQ ID NO: 121) (situee a 26 nucleotides en 
amont de la methionine d'initiation de Fenverine) et PS5D: 
TTGGGGAGGTTGGCCGACGA (SEQ ID NO: 122) (situee a 6 nucleotides en aval 
du codon non-sens de Fenverine. Des modifications de la sequence de Fenverine ont 

25 ete observes sur FADN de certains des patients (figure 17). 

EXEMPLE 3 : Detection d'une proteine selon 1' invention dans un echantillon 
biologique. 

- Preparation d'une fraction proteique purifiee de liquide cephalo- 
rachidien de patiehts atteints de SEP 
30 Apres im traitement a 56°C pendant 30 min, et elimination des 

immunoglobulines sur une colonne de proteine G HiTrap (Pharmacia), Fequivalent de 
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10 ml de LCR est depose sur une colonne de DEAE Sepharose CL-6B (Pharmacia). 
L'elution est realisee en Tris-HCl 20 mM pH 8,8, et un gradient de 0 a 0,4 M de NaCl, 
puis la fraction est dialysee 2 fois contre du tampon phosphate-NaCI (PBS). Apres 
concentration sur Ultrafree-MC (Millipore), la fraction est deposee sur une colonne de 
5 Superose 12 (FPLC Pharmacia) et eiuee en presence de PBS. Apres separation par 
electrophorese en gel de polyacrylamide-SDS, et electo-transfert sur une membrane 
d'Immobilon-P (Millipore), Ies bandes proteiques sont soumises a une hydrolyse 
trypsique menagee. 

- Analyse de la fraction proteique par spectrometrie de masse 
10 Les peptides digeres en presence de trypsine, sont analyses par la 

methode de MALDI-TOF, qui permet Fanalyse de peptides presents en melange. 
(COTTRELL J.S., Pept. Res., 1997, 7, 1 15-124). Les peptides caracterises en fonction 
de leur masse sont compares aux proteines et aux proteines associees selon 
F invention. 

15 EXEMPLE 4 : Detection d'anticorps specifiques anti-domaine env de HERV-7q. 

L'identification d'un long cadre de lecture ouvert au sein de la 
sequence env de HERV-7q, a permis de determiner une sequence proteique deduite 
SEQ ID NO:22 et 35 et figures 18-20 d'une region dudit gene. 

Les sequences de proteines deduites des sequences ID NO:22, 35 et 
20 des figures 18-20 sont positionnees comme suit par rapport a la figure 1 ou a la 
sequence ID NO:3 : 

SEQ ID NO:22 (cadre de lecture 1) et figure 19 : debut de la 
sequence codante : position 7874, fin de la sequence codante \* codon non-sens 
(position 9493) 

25 SEQ ID NO:35 : debut de la sequence codante ; position 7874, fin de 

la sequence codante 1 CT codon non-sens (position 9493) (cadre de lecture 1) 

Figure 19 : debut de la sequence codante : position 6970, fin de la 
sequence codante 1* codon non-sens (position 9493) (cadre de lecture 1) 

Figure 20 : debut de la sequence codante : position 6971, la fin du 
30 cadre de lecture est decalee selon le cas de 1 , 2 ou 3 codons 

Figure 21 : debut de la sequence codante : position 6972, la fin du 
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cadre de lecture est decalee selon le cas de 1 , 2 ou 3 codons * * 

Differents peptides correspondant a tout ou partie des SEQ ID 
NO:22 (voir SEQ ID NO:23-27 et 35) ont ete synthetises par genie genetique afin de 
tester leur specificite antigenique vis-a-vis de sera ou de tissus de patients atteints de 
5 SEP, par exemple. Brievement, tout ou partie de la region env de HERV-7q est sous 
clonee dans Ies vecteurs pQE30, 31 et 32. Les vecteurs pQE30 ? 31 et 32 contiennent 
en 5' du multi-site de clonage Ies sequences consensuelles pour la transcription (Ie 
promoteur fort du bacteriophage T5, 2 operateurs de l'operon lactose), la traduction 
(un site d'accrochage ribosomal synthetique). De meme ? pQE30> 31 et 32 possedent en 

10 3', le terminateur de transcription du phage 1 ainsi qu'un codon "Stop" pour la traduc- 
tion. L'expression de la proteine s'effectue apres transformation dans E. coli Ml 5. Le 
plasmide pQE30, 31 et 32 possedent en amont du site de polyclonage la sequence 
codante pour une suite de 6 histidines presentant une affinite pour les ions nickel. Cet 
enchainement permet la purification de la proteine chimerique exprimee. par adsorp- 

15 tion sur une resine constituee d f un ligand chelatant, Tacide nitrilotriacetique (NTA), 
charge de 4 ions nickel (resine NI-NTA, Qiagen). 

La transfonnation s'effectue par electroporation ou traitement au 
chlorure de calcium. Par exemple, une colonie d'£. coli Ml 5 est incubee dans 100 ml 
de milieu LB contenant 250 |ig de kanamycine, sous agitation a 37°C jusqu ! a 

20 I'obtention d'une DO 600 de 0,5. Apres une centrifiigation de 5 minutes a 2000g a 4°C, 
le culot bacterien est repris dans 30 ml de solution TFB1 (100 mM de chlorure de 
rubinium, 50 mM de chlorure de manganese, 30 mM d'acetate de potassium, 10 mM 
CaC12, 15% glycerol, pH 5.8), a 4°C pendant 90 minutes. Apres une centrifiigation de 
5 minutes a 2000g a 4°C, le culot bacterien est repris dans 4 ml de solution TFB2 (10 

25 mM de chlorure de rubidium, 10 mM de MOPS, 75 mM CaC12 ¥ 15% de glycerol , pH 
8). Les cellules peuvent etre gardees a -70°C par aliquot de 500 ml 20 ^1 de la ligation 
et 125 |il de cellules competentes sont melanges et places dans la glace 20 minutes. 
Apres un choc thermique de 42°C pendant 90 secondes, les cellules sont agitees 90 
minutes a 37°C dans 500 ml de milieu Psi-broth (milieu LB complements par 4 mM 

30 de MgS0 4 , lOmM de chlorure de potassium). Les cellules transferases sont etalees 
sur des boites LB-agar complementees par 25 (ag/ml de kanamycine, et 100^g/ml 
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d'ampicilline, et les boites sont incubees une nuit a 37°C. * 

Les clones potentiellement recombinants sont repiques de maniere 
ordonnee sur un filtre de nylon depose sur une boite LB-agar complementee par 25 
fag/ml de kanamycine et 100 jag/ml d'ampicilline. Apres une nuit a 37°C. les clones 
5 recombinants sont reperes par hybridation de l'ADN plasmidique avec la sonde 
nucleotidique amplifiee par PCR avec le couple d'amorces selon SEQ ID NO:45 et 
SEQIDNO:46. 

Une colonie independante, contenant 1'insert, est inoculee a 20 ml de 
milieu LB complementee par 25 |ig/ml de kanamycine et 100 |ig/ml d'ampicilline. 

10 Apres une nuit a 37°C sous agitation, 500 ml de meme milieu sont incubes au 1/50° 
par cette preculture jusqu'a 1'obtention d'une DO 600 de 0,8, puis 1 a 2 mM final d'IPTG 
est ajoute. Apres 5 heures, les cellules sont centrifugees 20 minutes a 4000 g. 

Une partie du culot cellulaire est repris dans 5 ml de tampon de 
sonication (50 mM de phosphate de sodium pH 7,8, 300 mM NaCl) puis place dans la 

15 glace. Apres une rapide sonication, les cellules sont centrifugees 20 minutes a 
10000 g. Une partie du culot cellulaire est repris dans 10 ml d'une solution 30 mM 
Tris/HCl-20% sucrose pH8. Les cellules sont incubees 5 a 10 minutes sous agitation, 
apres adjonction de 1 mM EDTA. Apres une centrifugation de 10 minutes a 8000 g a 
4°C, le culot est repris dans 10 ml de 5 mM de MgS04 glace. Apres 10 minutes dans 

20 la glace sous agitation, les cellules sont centrifugees 10 minutes a 8000 g a 4°C. 

Le culot est repris par 5 ml/g dans du tampon A (6 M GuHCl 
(chlorhydrate de guanidine), 0,1M phosphate de sodium, 0,0 1M Tris/HCl, pH 8), 1 
heure a temperature ambiante. Le lysat est centrifuge 15 minutes a 10000 g a 4°C, et le 
surnageant est complements par 8 ml de resine Ni-NTA, preequilibree dans du tampon 

25 A. Apres 45 minutes a temperature ambiante, la resine est coulee dans une colonne, 
lavee par 1 0 fois le volume de la colonne par du tampon A puis par 5 fois le volume 
da la colonne par du tampon B (8 M uree, 0,1 M phosphate de sodium, 0,01 M 
Tris/HCl, pH 8). La colonne est lave par du tampon C (8 M uree, 0,1M phosphate de 
sodium, 0,01 M Tris/HCl, pH 6,3) jusqu'a ce que TA280 soit inferieur a 0,01. La 

30 proteine recombinante est eluee par 10 a 20 ml de tampon D (8 M uree, 0,1 M 
phosphate de sodium, 0,01 M Tris/HCl, pH 5,9) puis par 10 a 20 ml de tampon E (8 M 
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uree, 0,1 M phosphate de sodium, 0,01 M Tris/HCl, pH 4,5), puis par 2Q ml de tampon 
F (6 M HC1, 0,2 M acide acetique). Apres une analyse en SDS-PAGE: la ou Ies 
fractions purifiees contenant la proteine chimerique ont permis Tobtention d'anticorps 
chez le lapin. Les anticorps obtenus sont testes par Western-blot apres revelation par 
5 un anticorps secondaire couple a la phosphatase alcaline. 

Des anticorps sont obtenus de la meme maniere, a partir de peptides 
synthetises chimiquement selon la technique de Merrifield (G. Barany and B. 
Merrifield, 1980, dans The peptides, 2, 1-284, E. Gross et J. Meienhofer, Academic 
Press, New York). 

10 Les anticorps specifiques obtenus sont utilises a fin de detection de 

Fexpression serique ou tissulaire de tout ou partie des sequences retrovirales endo- 
genes selon l'invention, dans les cas normaux et pathologiques. 

Les proteines d'origine serique ou tissulaire, sont separees sur gel 
d'acrylamide-SDS puis transferees sur un filtre de nitrocellulose a l'aide d'un appareil 

15 Novablot 2117-2250 (LKB). Le transfert est effectue sur une feuille de Hybond C- 
extra (Amersham) en utilisant un tampon CAPS 100 mM pH 11, methanol eau 
(V/V/V: 1/1/8) contenant 1 mM de CaCb. Apres un transfert de 1 heure a 0,8 
mA/cm 2 , la feuille est saturee une heure a temperature ambiante dans du PBS-0,5 % 
gelatine. La feuille est mise en presence de Tanticorps specifique a la concentration de 

20 1/1000 dans du PBS-0,25 % gelatine. Au bout de 2 heures, le filtre est lave 3 fois 15 
minutes dans du PBS-0,1 % de Tween-20, puis le filtre est incube 30 minutes en 
presence d ? un anticorps secondaire couple a la phosphatase alcaline (Promega), dilue 
au 1/7500 dans du PBS-0,25% gelatine. Apres trois lavages dans du PBS-0,1 % de 
Tween-20, le filtre est equilibre dans un tampon (100 mM de Tris-HCl pH 9,5, 100 

25 mM de NaCl, 5 mM de MgCb). La revelation est effectuee en presence de 45 jal de 
NBT a 75 mg/ml et 35 \il de BCIP a 50 mg/ml, pour 10 ml de tampon de phosphatase 
alcaline. 

Les proteines chimeriques obtenues par genie genetique, sont utili- 
sees aussi a fin de tests d'activite biologique, comme par exemple pour le test 
30 d'activite biologique du peptide de type CKS-17 identifie dans le domaine env de 
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HERV-7q (figure 5). \ '* '" 

EXEMPLE 5 : Obtention de sondes ribonucleiques codant pour les sequences env 
deHERV-7q. 

Les fragments de PCR obtenus sont sous clones dans le plasmide 
5 PGEM 4Z (Promega) qui possede de par et d'autre de son site de polyclonage, les 
sequences promotrices pour les ARN polymerase SP6 et T7. 

La methode de competence utilisee est l'electroporation. Le plasmide 
et le fragment de PCR sont hybrides dans un rapport de 50 ng de vecteur (coupe a Sma 
I) pour 100 ng de fragment de PCR (rendu a bout franc par traitement par le fragment 

10 de Klenow de l'ADN polymerase). L'incubation a lieu une nuit a 22°C dans le 
tampon de ligation (66 mM Tris-HCl pH 7,5, 5 mM MgC12. 1 mM dithioerythritol, 
1 mM ATP) en presence de 1 u. de T4 ADN ligase puis est arretee par denaturation 1 0 
minutes a 65°C. Parallelement, la souche d'E. Coli JM 105 est ensemencee une nuit a 
37°C dans du milieu LB. Cette preculture est diluee au 1/500 et placee a 37°C jusqu'a 

15 une DO 600 egale a 1. Pour la suite du mode operatoire les cellules seront toujours 
conservees au froid. Apres une centrifugation de 5 minutes a 3500 g a 4°C, le culot 
cellulaire est resuspendu dans 1/4 vol. d'eau glacee ultra-pure. Cette etape est repetee 5 
a 6 fois. Puis le culot est resuspendu dans 1/4000 vol. d'eau; 10 % de glycerol sterile 
sont ajoutes permettant la conservation des cellules electrocompetentes, par aliquots 

20 de 10 |nl a 20°C. A 50 jil de cellules electrocompetentes est ajoute 1 jil de la ligation ; 
le tout est soumis a une decharge electrique de 12,5 kV/cm, appliquee pendant 5,8 ms. 
Les cellules sont rapidement remises en suspension dans le milieu SOC incubees 1 
heure a 37°C, puis etalees, en presence de 2% X-Gal dans du dimethylformamide, et 
10 mM dlPTG, sur une boite de gelose LB-agar supplementee en ampicilline (100 

25 jig/ml). Apres une nuit a 37°C, les clones blancs potentiellement recombinants, sont 
repiques de maniere ordonnee sur une boite LB/ampicilline et "plrallelement sur un 
filtre de nylon depose sur une boite LB/ampicilline. Ces deux boites sont incubees une 
nuit a 37°C. Les clones recombinants sont alors reperes par hybridation avec une 
sonde nucleique araplifiee par PCR avec le couple d ? amorces selon SEQ ID NO:45 et 

30 SEQ ID NO:46 et marquee a la digoxygenine. 

Les clones recombinants sont cultives dans 50 ml de milieu 
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LB/ampicilline (100 fig/ml) en agitation pendant une nuit a 37°C. Apre^ une centrifu- 
gation a 3500 g pendant 15 minutes a 4°C, Ie culot bacterien est repris dans 4ml de 
tampon PI (50 mM Tris-HCi, lOmM EDTA, 400 j.ig/ml RNase A, pH 8) et 4ml de 
tampon P2 (200 mM NaOH, 1% SDS). Le melange est incube a temperature ambiante 
5 pendant 5 minutes. Apres adjonction de 4ml de tampon P3 (2.55 M d'acetate de potas- 
sium, pH 4,8)' le melange est centrifuge a 12000 g pendant 30 minutes a 4°C. Le 
surnageant est applique sur une colonne Qiagen-type 1 00, preequilibree avec 2 mi de 
tampon QBT (750 mM NaCl, 50 mM MOPS, 15% ethanol, pH 7). la colonne est lavee 
avec 2 fois 4ml de tampon QC (1M NaCl, 50 mM MOPS, 15 % ethanol, pH 7) et 

1 0 l'ADN est elue avec 2ml de tampon QF ( 1 ,2 M NaCL 50mM MOPS, 1 5 % ethanol, pH 
8). L'ADN est precipite avec 0,8 vol. d ! isopropanol, et centrifuge a 12000 g a 4°C 
pendant 30 minutes. Le culot est lave avec de Tethanol a 70 % glace, puis l'ADN 
plasmidique est repris par 2 fois 150 jal de tampon TE. 

Les sondes ribonucleiques sont utilisees comme sondes specifiques, 

15 en particulier pour la detection des transcrits exprimes par les sequences retro virales 
endogeries selon 1'invention. 

EXEMPLE 6 : Construction d'une souris transgenique contenant tout ou partie 
du gene de Fenverine. 

Une souris transgenique contenant tout ou partie de la sequence 
20 HERV-7q (SEQ ID NO:3) est construite afin d' identifier les sequences responsables 
de la specificite tissulaire, et pour evaluer le role de tout ou partie des motifs retro- 
viraux endogenes de type HERV-7q, en particulier tout ou partie des motifs pepti- 
diques de Tenverine. La technique de micro-injection utilisee se refere a la technique 
classique (Hogan et coll., (1994), Manipulating the mouse embryo, Cold Spring 
25 Harbor, Cold Spring Harbor Laboratory Press) ou a ses equivalents. Des formes iden- 
tiques a la molecule humaine normale de motifs de type HERV-7(f, dont Fenverine, ou 
des formes mutees, deletees, presentant des insertions ou tronquees sont testees afin de 
determiner les motifs critiques tant sur le plan normal que pathologique, et plus parti- 
culierement au cours du developpement foetal et lors des processus tumoraux. 
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Natl. Acad. Sci. USA 94, 7583-7588. 



WO 99/67395 .) PCT/FR99/01513 

53 

- Tonjes R.R. et al., J. AIDS and Hum. Retroviral, 1 996, 1 3, S26 1 -S267* 
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Molecular modeling of the HIV-1 protease and its substrate binding site. Science 243, 
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their reverse transcriptase sequences. EMBO J. 9, 3353-3362. 

Ainsi que cela ressort de ce qui precede, F invention ne se limite 

nullement a ceux de ses modes de mise en ceuvre, de realisation et d'application qui 

viennent d'etre decrits de fa?on plus explicite ; elle en embrasse au contraire toutes Ies 
15 variantes qui peuvent venir a Tesprit du technicien en la matiere, sans s'ecarter du 

cadre, ni de la portee, de la presente invention. 
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REVENDICATIONS 

1°) Fragment d'acide nucleique purifie, caracterise en ce qu'il 
compcend tout ou partie d'une sequence codant pour une sequence retroviral endo- 
gene humaine, qui presente au moins des motifs retroviraux de type env, repondant a 
5 la sequence SEQ ID NO:l ou a une sequence presentant un niveau d'homologie avec 
ladite sequence SEQ ID NO:l superieur ou egal a 80% sur plus de 190 nucleotides ou 
superieur ou egal a 70% sur plus de 600 nucleotides pour les domaines de type env. 

2°) Fragment d'acide nucleique selon la revendication L caracterise 
en ce qu'il presente a la fois de motifs retroviraux correspondant a un domaine env et 

10 repondant a la sequence SEQ ID NO:l et des motifs retroviraux correspondant a un 
domaine gag et repondant a la sequence SEQ ID NO:2 ou a une sequence presentant 
un niveau d'homologie superieur ou egal a 80% sur plus de 190 nucleotides ou supe- 
rieur ou egal a 70% sur plus de 600 nucleotides pour les domaines de type env et un 
niveau d'homologie superieur ou egal a 90% sur plus de 700 nucleotides ou superieur 

15 ou egal a 70% sur plus de 1200 nucleotides pour les domaines de type gag, lesquels 
motifs ne presentent aucune insertion ou deletion superieure a 200 nucleotides. 

3°) Fragment d'acide nucleique, caracterise en ce qu'il comprend un 
segment d'une sequence selon la revendication 1 ou la revendication 2 et notamment 
les sequence SEQ ID NO:3-22, 28 et 61, les sequences nucleiques complementaires et 

20 les sequences inverses complementaires des sequences precedentes ainsi que les 
fragments issus des regions codantes des sequences precedentes correspondant a un 
cadre glissant superieur ou egal a 14 nucleotides ou leurs sequences complementaires. 

4°) Transcrits, caracterises en ce qu'ils sont generes a partir des 
sequences selon Tune quelconque des revendications 1 a 3. 

25 5°) Reactif de diagnostic pour la detection differentiate de 

sequences nucleiques endogenes humaines completes ou partielles, presentant des 
motifs retroviraux, selectionnes parmi les sequences SEQ ID NO:l et/ou SEQ ID 
NO:2, caracterise en ce qu'il est selectionne dans le groupe constitue par les sequences 
SEQ ID NO:l-22, 28, 37-57, 59-61 et 121-122, les sequences nucleiques comple- 

30 mentaires et les sequences inverses complementaires des sequences precedentes, par 
les fragments nucleotidiques capables de definir ou d'identifier les sequences SEQ ID 
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N0:1 et/ou SEQ ID NO:2 et toute sequence flanquante ou les chevaifehant ainsi que 
par les fragments issus des regions codantes des sequences SEQ ID NO: 1-22 et 6L 
correspondant a un cadre glissant superieur ou egal a 14 nucleotides ou leurs 
sequences complementaires, eventuellement marquees avec un marqueur approprie." 
5 6°) Reactif selon la revendication 5, caracterise en ce qu'il est choisi 

dans les regions situees entre les nucleotides 3065 et 4390, les nucleotides 6965 et 
9550 ou les nucleotides 2502-2865 de la SEQ ID NO:3. 

7°) Reactif selon la revendication 5, caracterise en ce qu'il est selec- 
tionne parmi les sequences SEQ ID NO:37-57, 59-60 et 121-122 et en ce qu'il est apte 
1 0 a etre utilise comme amorce. 

8°) Reactif selon la revendication 5, caracterise en ce qu'il est selec- 
tionne parmi les sequences suivantes : 

- un fragment de 1505 nt amplifie par le couple d'amorces SEQ ID 
NO:37 et SEQ ID NO:38 (amorces GIF et G1R), 

15 - un fragment de 2529 nt amplifie par le couple d'amorces SEQ ID 

NO:45 et SEQ ID NO:46 (amorces E1F et E1R) 

- un fragment de 182 nucleotides repete deux fois, situe en amont du 
domaine gag aux positions 2502-261 1/2613-2865 

et en ce qu'il est apte a etre utilise comme sonde. 

20 9°) Reactif selon la revendication 5, caracterise en ce qu'il est choisi 

dans le groupe constitue par les fragments codants ou non-codants pour tout ou partie 
de Fenverine et notamment les fragments comprenant au moins 14 nucleotides et plus 
particulierement les fragments codant pour la partie C-terminale de Fenverine, soit a 
partir de Facide amine 291, soit a partir de Facide amine 32L a compter du codon 

25 codant pour la premiere methionine. 

10°) Procede de detection rapide et differentiel des sequences 
nucleiques retrovirales endogenes de type env ou env et gag, de leurs variants 
normaux ou pathologiques, par hybridation et/ou amplification genique, realise a partir 
d'un echantillon biologique, lequel procede est caracterise en ce qu'il comprend : 

30 (a) une etape dans laquelle Fon met en contact un echantillon biolo- 

gique a analyser avec au moins une sonde selon la revendication 5 ? la revendication 6 
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ou la revendication 8 et 

(b) une etape dans laquelle on detecte par tout moyen appfoprie le ou 
les produits resultants de Finteraction sequence nucleotidique-sonde. 

11°) Procede de detection selon la revendication 10 ? caracterise en 
5 ce qu'il comprend : 

* prealablement a Fetape (a) : 

. une etape de preparation du tissu ou du liquide biologique 

concerne, 

. une etape d'extraction de Facide nucleique a detecter, et 
10 . au moins un cycle d'amplification genique mis en oeuvre a Taide 

d'au moins un reactif selon Tune quelconque des revendications 5 a 7 et 

* posterieurement a Fetape (b) : 

. une etape de comparaison des sequences nucleiques obtenues dans 
ledit echantillon biologique avec les sequences retrovirales endogenes humaines selon 
15 Tune quelconque des revendications 1 a 3, par tout moyen approprie et notamment par 
sequen<?age, Southern-blot, coupure de restriction, SSCP ou toute autre methode 
permettant d'identifier une insertion ou une deletion ou encore une simple mutation 
entre les differentes sequences comparees. 

12°) Procede de detection des transcrits selon la revendication 4, 
20 caracterise en ce qu'il comprend : 

- le prelevement des ARN messagers provenant d'echantillons 
biologiques temoins et d'echantillons analogues preleves chez des patients et 

- Fanalyse qualitative et/ou quantitative desdits ARNm, par hybri- 
dation in situ, par dot-blot, Northern-blot, RNAse mapping ou RT-PCR, a Taide d'un 

25 reactif de diagnostic selon Tune quelconque des revendications 5 a 9. 

13°) Sequences chimeres, caracterisees en ce qu'elles sont consti- 
tuees par un fragment de 17 a 40 nucleotides d'une sequence flanquante selectionnee 
dans le groupe constitue par les transcrits et ADNc des sequences genomiques, qui 
codent pour tout ou partie d'un facteur, dont la fonction, la regulation/deregulation ou 

30 Talteration est associee a Texpression normale ou pathologique ou a la regula- 
tion/deregulation de motifs appartenant a ladite famille HERV-7q, ces sequences 
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correspondant a des sequences nucleotidiques codant pour des genes^itues dans des 
regions flanquantes situees en amont et/ou en aval d'une sequence retro virale de ladite 
famille HERV-7q dont Tune des extremites ne peut se trouver a une distance excedant 
120 kb, associee a un motif retroviral endogene de type HERV-7q comprenant entre 
5 1 7 et 40 nucleotides selon les revendications 1 a 4. 

14°) Methode de detection et/ou devaluation d'une sur-expres- 
sion/sous-expression ou d'une modification d'au moins Tune des sequences ou frag- 
ments de sequences retrovirales endogenes de type HERV-7q et/ou de leurs sequences 
flanquantes associees, selon Tune quelconque des revendications 1 a 9, caracterisee en 
10 ce qu'elle comprend : 

- le depot sur un support approprie, de l'ADNc provenant de clones, 
de produits de PCR obtenus a partir d'ADN genomique. de produits de RT-PCR 
provenant de transcrits ou encore de sequences oligonucleotidiques specifiques, 
Iesdites sequences d'ADN etant des sequences ou des fragments de sequences retro- 

15 virales endogenes de type HERV-7q et/ou leurs sequences flanquantes, constitutes par 
les transcrits et ADNc des sequences genomiques v qui codent pour tout ou partie d'un 
facteur, dont la fonction, la regulation/deregulation ou l'alteration est associee a 
Texpression normale ou pathologique ou a la regulation/deregulation de motifs 
appartenant a ladite famille HERV-7q ? ces sequences correspondant a des sequences 

20 nucleotidiques codant pour des genes situes dans des regions flanquantes situees en 
amont et/ou en aval d'une sequence retro virale de ladite famille HERV-7q dont l'une 
des extremites ne peut se trouver a une distance excedant 120 kb et/ou une sequence 
chimere selon la revendication 13, 

- l'hybridation dudit support avec au moins une sonde marquee de 
25 maniere adequate obtenue, par exemple, par retrotransposition d'un melange d'ARN 

provenant de cellules, de tissus ou de liquides biologiques pFovenant de temoins 
reputes normaux, de membres de populations ethniques differentes, de patients atteints 
de pathologies souvent associees a une expression de retrovirus, comme les processus 
tumoraux, ou comme les maladies auto-immunes, et 
30 - la detection des hybrides formes. 

15°) Methode selon la revendication 14, caracterisee en ce que ledit 
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transcrit ou ADNc est selectionne dans le groupe constitue par les sequences SEQ ID 
NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant superieur ou 
egal a 14 nucleotides ou leurs sequences complementaires. 

16°) Methode selon la revendication 14 ou la revendication 15, 
5 caracterisee en ce que ledit support comprend en outre toute sequence retrovirale 
endogene ou exogene. 

17°) Kit de detection et/ou devaluation d ? une maladie auto-immune 
et notamment des neuropathologies a etiologie auto-immune, caracterise en ce qu'il 
comprend outre les tampons necessaires a la mise en oeuvre d ? un procede selon Tune 
1 0 quelconque des revendications 1 4 a 1 6 : 

- des reactifs A de diagnostic selon Tune quelconque des revendica- 
tions 5 a 9, et 

- des reactifs B constitues par les transcrits et ADNc des sequences 
genomiques, qui codent pour tout ou partie d'un facteur, dont la fonction, la regula- 

15 tion/deregulation ou Palteration est associee a l'expression normale ou pathologique 
ou a la regulation/deregulation de motifs appartenant a ladite famille HERV-7q, ces 
sequences correspondant a des sequences nucleotidiques codant pour des genes situes 
dans des regions flanquantes situees en amont et/ou en aval d'une sequence retrovirale 
de ladite famille HERV-7q dont Tune des extremites ne peut se trouver a une distance 

20 excedant 120 kb, 

lesquels reactifs sont de preference fixes sur un support approprie. 

18°) Kit selon la revendication 17, caracterise en ce que lesdits 
reactifs B sont selectionnes dans le groupe constitue par les sequences SEQ ID 
NO:62-67 et 119 et leurs fragments correspondant a un cadre glissant superieur ou 
25 egal a 14 nucleotides ou leurs sequences complementaires. 

19°) Produits de traduction, caracterises en ce qu'ils sont codes par 
une sequence nucleotidique selon Tune quelconque des revendications 1 a 4. 

20°) Peptide, caracterise en ce qu ! il est susceptible d'etre exprime a 
Faide d'une sequence nucleotidique selectionnee dans le groupe constitue par les 
30 sequences SEQ ID NO: 1-22, 28 et 61 selon Tune quelconque des revendications 1 a 4. 

21°) Peptide selon la revendication 20, caracterise en ce qu'il 
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englobe les peptides derives comprenant entre 5 et 540 aminoacides et notamment un 
fragment de 538 aminoacides, commen9ant a la premiere methionine de la sequence 
SEQIDNO:26(enverine). 

22°) Peptide selon la revendication 20 ou la revendication 21, 
5 caracterise en ce qu'il est selectionne dans le groupe constitue par : 

. les sequences SEQ ID NO:23-36 ; 

. la sequence SEQ ID NO:58 ; 

. un fragment C-terminal de la sequence SEQ ID NO:26, soit a partir 
de l'acide amine 291, soit a partir de Tacide amine 321, a compter de la premiere 
10 methionine de la sequence SEQ ID NO:26 ; 

- un peptide de type CKS-17/CKS-25 present dans Tune des 
sequences SEQ ID NO:23-36 ou 58 ; et 

- les peptides presentant une affinite avec un des haplotypes du 
systeme HLA de classe I ou de classe II et notamment les fragments 399-471, 244-271 

15 de Fenverine, ainsi que les peptides de sequence SEQ ID NO:68-118, conformement 
au Tableau L 

23°) Peptide selon Tune quelconque des revendications 20 a 22, 
caracterise en ce qu'il est obtenu a partir des sequences nucleiques selon Tune 
quelconque des revendications 1 a 4, dans lesquelles au moins un codon non-sens peut 
20 etre remplace par un codon codant pour Tun des aminoacides suivants : Phe (F), Leu 
(L), Ser (S), Tyr (Y), Cys (C), Trp (W), Gin (Q), Arg (R), Lys (K), Glu (E) ou Gly 
(G). 

24°) Compositions immunogenes ou vaccinales, pour la protection 
contre les maladies auto-immunes, notamment chez les sujets a risque, caracterisee en 
25 ce qu'elle comprend au moins un peptide comprenant au moins un motif de type CKS 
et/ou au moins un motif selectionne dans le groupe constitue par les peptides presen- 
tant une affinite avec un des haplotypes du systeme HLA de classe I ou de classe II et 
au moins un vehicule pharmaceutiquement acceptable. 

25°) Composition selon la revendication 24, caracterisee en ce que 
30 ledit peptide presentant une affinite avec un des haplotypes du systeme HLA de classe 
I ou de classe II, est selectionnee dans le groupe constitue par les peptides tels que 
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definis dans le Tableau I. * 

26°) Composition selon la revendication 24 ou la revendication 25, 
caracterisee en ce que ledit peptide presente la sequence SEQ ID NO: 120. 

27°) Anticorps, caracterise en ce qu'il est dirige contre Tun oii 
5 plusieurs des peptides selon l ! une quelconque des revendications 20 a 23. 

28°) Composition pharmaceutique, caracterisee en ce qu'elle 
comprend des anticorps neutralisants produits a partir des peptides du Tableau I (SEQ 
ID NO:68- 1 1 8) et leurs homologues. 

29°) Precede de depistage immunologique differentiel de sequences 
10 retrovirales endogenes humaines de la famille HERV-7q normales ou pathologiques, 
caracterise en ce qu'il comprend la mise en contact d'un echantillon biologique avec 
un anticorps selon la revendication 27, la lecture du resultat etant revelee par un 
moyen approprie, notamment EIA, ELISA, RIA, fluorescence. 

30°) Precede ^identification et de detection de motifs retroviraux 
15 endogenes, anormalement exprimes dans le cadre de pathologies associees au cancer, 
ou de neuropathologies en particulier autoimmunes, au premier rang desquelles la 
sclerose en plaques, caracterise en ce qu'il comprend I'analyse comparee des sequences 
extraites d f un echantillon biologique avec les sequences selon Tune quelconque des 
revendications 19 a 23. 

20 31°) Application des sequences selon Tune quelconque des revendi- 

cations 1 a 9, 13, 14 ou 19 a 23 au diagnostic, au pronostic, a revaluation de la 
susceptibilite genetique, a toutes maladies humaines induites, innees ou acquises en 
particulier celles a composantes cancereuses, autoimmunes et/ou a incidence neuro- 
logique, comme la sclerose en plaques, les syndromes associes et les maladies neuro- 

25 degeneratives ou intervient tout ou partie des sequences selon Time quelconque des 
revendications 1 a 5 et des formes endogenes ou exogenes apparentebs. 

32°) Sequences nucleiques hybrides, caracterisees en ce qu'elles 
comprennent des sequences ou motifs selon Tune quelconque des revendications 1 a 
9, combines avec des. sequences ou motifs d'origine endogene ou d'origine ou induits 

30 de maniere exogene. 

33°) Vecteur recombinant de clonage ou d'expression, caracterise en 
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ce qu'il comprend une sequence nucleique selon l'une quelconque des revendications 
1 a 4. 

34°) Composition immunogene ou vaccinale, caracterisee en ce 
qu'elle comprend un vecteur incluant au moins une sequence nucleique codant un 
5 peptide tel que defini dans le Tableau I, eventuellement associee a une sequence 
codant un motif de type CKS-17. 

35°) Vecteur de therapie genique, caracterise en ce qu'il comprend 
tout ou partie des sequences nucleiques retrovirales endogenes de type HERV-7q 
selon Tune quelconque des revendications 1 a 4. 
10 36°) Vecteur selon la revendication 35, caracterise en ce que lesdites 

sequences sont selectionnees dans le groupe constitue par les sequences SEQ ID 
NO:2, 20et21. 

37°) Animaux transgeniques, caracterises en ce qu'ils comprennent 
tout ou partie d'une sequence de type HERV-7q (SEQ ID NO: 1-22 , 28 et 61). 

15 
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CCCTGGGGCGGGCTTCCTTTCTGGGATGAGGGCAAAACGCCTGGAGATACAGCAATTATCTTGCAACTGAG 

AGACAGGACTAGCTGGATTTCCTAGGCCGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACCACGTCCAC 

CTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGCTAATTAGGCA 

AAGAC AGGAGGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACAACAATCGGGATA 

TAAACCCAGGCATTCGAGCTGGCAACAGCAGCCCCCCTTTGGGTCCCTTCCCTTTGTATGGGAGCTGTTTTC 

A TGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCTTACGGCTCGAGCTGAGCT 

TTTGCTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGACTCCCATCCCTCTGGATCCT 

GCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCGCCCATTGCCGCTCCCAATTGGGCTA AAGGCTTGCCA 

TTGTTCCTGCACGGCTAAGTGCCTGGGTTTGTTCTAATTGAGCTGAACACTAGTCACTGG GTTCCATGG7TC 

TCTTC TGTGACCCACGGCTTCTAATAGAACTATAACACTTACCACATGGCCCAAGATTCC ATTCCTTGGAAT 

CCGTGAGGCCAAGAACTCCAGGTCAGAGAATACGAGGCTTGCCACCATCTTGGAAGC GGCCTGCTACCATCT 

TGGAAGTGGTTCACCACCATCTTGGGAGCTCTGTGAGCAAGGACCCCCCGGTAACATTTTGGCAACCACGAA 

CGGACATCCAAAGTGGTGAGTAATATTGGACCACTTTCACTTGCTATTCTGTCCTATCCTTCCTTAGAATTG 

GAGGAAAATACCGGGCACTTGTCGGCCAGTTAAAAACGATTAGTGTGGCCACCGGACTTAAGACTCAGGTGT 

GAGGCTATCTGGGGAAGGGCTTTCTAACAACCCCCAACCCTTCTGGGTTGGGGACTTGGTTTGCCTCAAGCC 

AGCTTCCACTTTCAGTTTTCTTGGGGAAGCCGAGGGCCGACTAGAGGCAGAAAGCTGTCGTCCTGAACTCCC 

GGCAGTAGCCGGTTGAGATCATGGTGTAGCCAGAAGTCTCAACAGTCGCCCATGCATGCACCCCTATCTTTC 

CTTCTGACCCATACCTCCTGGGTCCCAACCACAACTTTCTTCAAAGTGTAGCCCCAAAATTCTCCTTACCTC 

TGAATATACTTCCTCTGATCCCTGCCTCCTAGGTACTATTGGTTCAGACTTCCATTTCCTCTAGCAAGTTGT 

ATCTCCAAAGGGATCTAAGGAAGCTCTGCGCTGCGTCCTTAGGCACCTAGGCTATAACCCAGGGAGTCTTAT 

CCCTGGTGTCCCTCCCAATTTAGGCATACAGCTCTTGACATGGGCAGTTATGTAGGACCCACTCCCCACCAC 

CCTTGCCAGGGCCCCAAGTTTGTAAATGGCTGAGGGAAAAGAGAGACAGAGGAGAGAGAGAGAAATGGAGGA 

GAAAGAGAGAGAGACAGAGAGGAGAGAGAGACAGTGAGAGAGACAGAAGAGAGAGAGAGACAAAGAGGAGAG 

AGAGAGAGTCAAAGAGAGAAAGAAAGAGAAAGAAATAGTAAAAAACAGTGTGCCCTATTCCTTTAAAAGCCA 

GGGTAAATTTAAAACCTGTACTTGATAATTGAAGGTCTTCTCTGTGACCCTATAGCACTCCAATCCACTTTG 

TGGTCAGTGTAAATAAGAGCATAGGCCGAAAGCACTGAGGCCATTGACAACCCGTAGCTTCCCTATCAAAAA 

TCCTTAACCCAGTAACCCGCAGATGGACCAAATGCATTCAGTCGGTAGCGCAACTGCTTTGCTAAAAGTAGA 

AAAGTAACTTTTAGAGGAAACCTCATTGTGAGCACACCTCACCTGTTCAGAATTATTCTAATAAAAAAAGCA 

AAAAGGTAGCTTACTAACTCAAAAATCTTAAAGTATGGGGCTATTCTGTTAGAAAAAGGTAATGTAACTCCA 

ACCACTGATAATTCCCTTAACCCAGCAGATTTCCTAACGGGATTTAAATCTTAATTACCATACAAAGGTCCG 

ACCAGACCTAGGCGGAACTCCCTTCAGGACAGGACGATAGATGGTTCCTCCCAGGTGATTGAGGAAAAAAAC 

CACAATGGGTATTCAGTAATTGATACGGGGACTCTTGTGGAAGCAGAGTTAGAAAAATTGCCTAATAACTGG 

TCTCCTCAAACGTGTGAGCTGTTTGCACTCAGCCAAGCCTTAAAGTACTTACAGAATCAAAAGACTATCTCA 

ATCCTGATTCAAAAGGTTAGCTACACCCTCTCTGTAATGCATTTGCATAAGAACTTGTTTATGGGAATGCAT 

CTTCrTCCCCCA g CT ^r^^ 

GCAATGTTGGGCATGCTGGTAAAGGACCACTAGAATCCAGCAGCCCAGACCCCTTT CTTTGTGGTCAAGAAA 
GGC GGGAAAAGGGGTGCAGGACTGCTACATCGGTAAGCATAACTAATCCGA TAAACAGAGGTCCATGGGTGG 
TTACGCACCCTGGAAAGGAA CTCAC CCCTGAGCACAAAGGCAATGTTGGGCACGCTGGTAAAGGACCACTAG 
AATCCAGCAGCCTGGACCCCTTTCTTTGTGGTCAAGAGAGGCAGGAAAACAGGTGCA GGACTGCAACATCAG 
TGAGCATA ACTAATTCGATAAGCAGAGGTCCATGGGTGGTGATGCACCCTGGAAAGAA TAAGCATTAGGACC 
ATAGAGGACACTCCAGGACTAAAGCTCATCGGAAAATGACTAGGGTTGCTGGCATCCCTATGTTCTTTTTTC 
AGATGGGAAACGTTCCCCGCAAGACAAAAACGCCCCTAAGACGTATTCTGGAGAATTGGGACCAATTTGACC 
CTCA ^_ A nn^>r aa ^ aa a^aRRrr;arTTATATTCTTCTGCAGTGCCG CCrGGCACrCC rGAGGGAAGrATAAAT 
TATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGGCAAATGGAGTGAAGTGCCATAA GTACAAACT 
TTCTTTTC ATTAAGAGACAACTCACAATTATGTAAAAAG7GTGATTTATGCCCTACAGGAAGCCT TCAGAGT 
CTACCTCCCTATCCCAGCATCCCCGACTCCTTCCCCAACTAATAAGGACCCCCCTTCAACCCA AATGGTCCA 
AAAGG AGA TAGACAAAAGGGTAAACAGTGAACCAAAGAGTGCCAA TA TTCCCCAATTA TG ACCCC TCCAAGC 
AGT GGGAGGAAGAGAA TTCGGCCCAGCCAGAGTGCA TGTGCCTTTTTCTCTCCCAG ACTTAAAGCAAA TAAA 
AACAGACTTAGGTAAATTCTCAGA TAACCCTGA TGGCTA TA TTGA TGTTTTACAAGGGTTAGGACAATTCTT 
TGATCTGACATGGAGAGATATAATGTCACTGCTAAATCAGACACTAACCCCAAATGAGAG AAGTGCCACCAT 
AACTGCAGCCTGAGAGTTTGGCGATCTCTGGTATCTCAGTCAGGTCAATGATAGGAT GACAACAGAGGAAAG 
AGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGTCTAGACCCTCATTGGGACA CAGAATCAGAACATGG 
AGA TTGGTGCTGCAGACATTTGCTAACTTGTGTGCTAGAAGGACTAAGGAAAA CTAGGAAGAAGTCTATGAA 
TTACTCAATGATGTCCACCATAACACAGGGAAGGGAAGAAAATCCTACTGCCTTTCTGGAGA GACTAAGGGA 

GGCA TTGAGGAA GCG TGCC TC TCTG TCACCTGA C TCTTCTGAAGG CCAACTAA TCTTAAA GCG TAAG TTTAT 
CACTCAGTCAGCTGCAGACATTAGAAAAAAACTTCAAAAGTCTGCCGTAGGCCCGGAGCA AAACTTAGAAAC 
CC TATTGAACTTGGCAACCTCGGTTTTTTATAA TAG AG A TCAGGAGGAGCAGGCGGAACAGG ACAAA CGGGA 
TTAAA AAAAAGGCCACCGCTTTAGTCATGACCCTCAGGCAAGTGGACTTTGGAGGCTCTGGA AAAGGGAAAA 
GCTGG GCAAATTGAA TGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACA CTTTAAAAAAGA TTGTC 
CAAGTAGAAGTAAGCCGCCCCCTCGTCCA TGCCCCTTA TTTCAA GGGAATCA C TG GAAGGCCCA C TGCC CCA 
GGG GACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGATCCAGCAG CAGGACTGAGGGTGCCTGGGGC 
AAGCG CCATCCCATGCCATCACCCTCACAGAGCCCTGGGTATGCTTGACCATTGAGGGCCAGGAGGTTGTCT 
r.CTGGACACT GGTGCGGTCTTCTTAGTCTTACTCTTCTGTCCCGGACAACTGT CCTCCAGATCTGTCACTAT 
CTG AGGGGGTCCTAAGACGGGCAGTCACTAGATACTTCTCCCAGCCACTAAGTTATGACT GGGGAGCTTTAT 
TC TTTTCACATGCTTTTCTAATTATGCTTGAAAGCCCCACTACCTTGTTAGGGAGAGACATTCTA GCAAAAG 
CAGGGGCC ATTATACACCTGAACATAGGAGAAGGAACACCCGTTTGTTGTCCCCT GCTTGAGGAAGGAATTA 
ATCCTGAAGTCTGGGCAACAGAAGGACAATATGGACGAGCAAAGAATGCCCGTCC TGTTCAAGTTAAACTAA 
AGGATT CCACCTCCTTTCCCTACCAAAGGCAGTACCCCCTCAGACCCAAGGCCCAA CAAGGACTCCAAAAGA 
TTGTTA AGGACCTAAAAGCCCAAGGCCTAGTAAAACCATGCAGTAACCCCTGCAGTAC TCCAATTTTAGGAG 
TACAGA^CCCAACAGACAGTGGAGGTTAGTGCAAGATCTCAGGATTATCAATGAGGCTGTTGTTCCTCTA7_ 
AGCC AGCTGTACCTAGCCCTTATACTCTGCTTTCCCAAATACCAGAGGAAGCA GAGTGGTTTAC AGTCCTGG 
ACCTTCAGGATGCCTTCTTCTGCATCCCTGTACATCCTGACTCTCAATTCTTGTT TGCCTTTGAAGATACTT 

FIGURE 1.1 



1-43 
2 1 5 
2B7 
359 
431 
503 



• ^ i 
S 53 
935 
1007 
1079 
1151 
1223 
1295 
1367 
1439 
1511 
1583 
1655 
1727 
1799 
1871 
1943 
2015 
2087 
2159 
2231 
2303 
2375 
2447 
2519 
2591 
2663 
2735 
2807 
2879 
2951 
3023 
3095 
3167 
3239 
3311 
3383 
3455 
3527 
3599 
3671 
3743 
3315 
3887 
3959 
4031 
4103 
4175 
4247 
4319 
4391 
4463 
4535 
4607 
4679 
4751 
4823 
4895 
4967 
5039 
5111 
5183 



region 
reoetee 

RI 



regions 
repetees 
en tandem 
R2 



domaine 



domaine 
ooi 



WO 99/67395 



PCT/FR99/01513 



2/64 

CAAAC CCAACATCTCAACTCACCTGGACTATTTTACCCCAAGGGTTCAGGGATAGTCCCCATCTATTTGGCC 
AGGC ATTAGCCCAAGACTTGAGCCAATCCTCATACCTGGACACTTGTCCTTCGGTAGGT GGATGATTTACTT 
TTGGCCGCCCATTCAGAAACCTTGTGCCATCAAGCCACCCAAGCGCTCTTCAATTTCCTCGCT ACCTGTGGC 
TACATGGTTTCCAAACCAAAGGCTCAACTCTGCTCACAGCAGGTTACTTAGGGCTAAAATT ATCCAAAGGCA 
CCAGGGCCCTCAGTGAGGAACACATCCAGCCTATACTGGCTTATCCTCATCCCAAAA CCCTAAAGCAACTAA 
GGGGATTCCTTGGCGTAATAGGTTTCTGCCGAAAATGGATTCCCAGGTATGGCGAAATAGC CAGGTCATTAA 
ATACAC TAATTAAGGAAACTCAGAAAGCCAATACCCATTTAGTAAGATGGACAACTGAAGT AGAAGTGGCTT 
TCCA GGCCCTAACCCAAGCCCCAGTGTTAAGTTTGCCAACAGGGCAAGACTTTTCTT CATATGTCACAGAAA 
AAACAGGAATAGCTCTAGGAGTCCTTACACAGATCCGAGGGATGAGCTTGCAACCTGTGGCAT ACCTGACTA 
AGGAAATTGATGTAGTGGCAAAGGGTTGACCTCATTGTTTACGGGTAGTGGTGGCAGTAGC AGTCTTAGTAT 
CTGAAGCAGTTAAAATAATACAGGGAAGAGATCTTACTGTGTGGACATCTCATGATGTGAA TGGCATACTCA 
C TGCTAAAGGAGACTTGTGGCTGTCAGACAACTGTTTACTTAAATGTCAGGCTCTATTACTTGAAG GGCCAG 
TGCTG CGACTGTGCACTTGTGCAACTCTTAACCCAGCCACATTTCTTCCAGACAATGAAGA AAAGATAAAAC 
ATAACTGTCAACAAGTAATTTCTCAAACCTATGCCACTCGAGGGGACCTTTTAGAGGTTCCTTTGACTGATC 
CCGAC CTCAACTTGTATACTGATGGAAGTTCCTTTGTAGAAAAAGGACTTCGAAAAGTGGG GTATGCAGTGG 
TCAG TGATAATGGAATACTTGAAAGTAATCCCCTCACTCCAGGAACTAGTGCTCAGCTAGCAGAACTAATAG 

CCCT CACT T GGG C AC T AG AAT T AG G AG AAG AAAAAAGGG C AAAT AT AT AT AC AG AC T C T A AAT AT G C T T AC C 
TAGTCCTCCATGCCCATGCAGCAATATGGAAAGAAAGGGAATTCCTAACTTCTG AGAGAACACCTATCAAAC 
ATCAGGAAGCCATTAGGAAATTATTATTGGCTGTACAGAAACCTAAAGAGGTGG CAGTCTTACACTGCCGGG 

GTC A T C AG AAAGG AAAGG AAAGGG AAAT AG AAG AG AAC T G C C AAG C AG AT AT T G AAG C C AA AAG AG C T GC AA 
GGCA GGACCCTCCATTAGAAATGCTTATAAAACAACCCCTAGTATAGGGTAATCCCCTCCGGGAAACCAAGC 
CCCAGTAC TCAGCAGGAGAAACAGAATGGGGAACCTCACGAGGACAGTTTTCTCCC CTCGGGACGGCTAGCC 
ACTGAAGAA GGGAAAATACTTTTGCCTGCAACTATCCAATGGAAATTACTTAAAACCCT TCATCAAACCTTT 
CACT TAGGCATCGATAGCA CCCATCAGATGGCCAAATCATTATTTACTGGACCAGGCC T TTTCAAAACTATC 
AAGCA GATAGTCAGGGCCTGTGAAGTGTGCCAGAGAAATAATCCCCTGCC TTATCGCCAAGCTCCTTCAGGA 
GAA CAAAGAACAGGCCATTACCCTGGAGAAGACTGGCAACTGATTTTACCCACA AGCCCAAACCTCAGGGAT 
TTCAGTAT CTACTAGTCTGGGTAGATACTTTCACGGGTTGGGCAGAGGCCTTCCCCTGTAGGA CAGAAAAGG 

CCCAA GAGG TAA TAAAGGCA C TAGTTCA TGAAA TAA TTCCCA GA TTCGGA CTTCCCCGAGGC T TA CA GA G TG 
ACAATAG CCCTGCTTTCCAGGCCACAGTAACCCAGGGAGTATCCCAGGCGTTAGGTATACGATATCACTTAC 
ACTGCGCC TGAAGGCCACAGTCCTCAGGGAAGGTCGAGAAAATGAATGAAACACTCAAAGGAC ATCTAAAAA 

AGCAAA CCCA GGAAACCCACC TCA CA TGGCCTG C TC TG T TGCC TA TAGCC TTAAAAAGAA TCTGCAA CTT TC 
CCCAAA AAGCAGGACTTAGC CCATACGAAATGCTGTATGGAAGGCCCTTC A TAACCAATGACCTTGTGCTTG 

ACCCA AGACAGCCAACTTAGTTGCAGACA TCACCTCCTTAGCCAAA TA TCAACAAG TTCTTAAAACA TTACA 
AGGAA CCTATCCCTGAGAAGAGGGAAAAGAACTATTCCACCCTTGTGACATGGTAT TAGTCAAGTCCCTTCC 
CT CTAATTCCCCATCCCTAGATACATCCTGGGAAGGACCCTACCCAGT CATTTTATCTACCCCAACTGCGGT 
TAAAGTGG CTGGAGTGGAGTCTTGGATACATCACACTTGAGTCAAATCCTGGATACTGCC AAAGGAACCTGA 
AAA TCCA GGAGACAAC GCTAGC TA TTCCTGTGAACCTCTAGAGGA T T TGCGCC TGCTCT TCAAA CAA CAACC 
A GGAGGAAA GTAA C TAAAA TCA TAAA TCCCCA TGGCCC TCCCTTA TCA TA TTTTTCTCTTTA C T G T TC TTTT 
ACCC TCTTTCACTCTCAC TGCACCCCCTCCATGCCGCTGTATGACCAGTAGCTCC C CTTACCAAGAGTTTCT 
ATGGAGAAT GCAGCGTCCCGGAAATATTGATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTT 
CACTGCCCA C A CCCA TA TGCCCCGCAACTGCTA TCACTCTG CCA C TCTT TGCA TGC ATGCAAA TA CTCA T TA 
TTGGA CAGGAAAAA TGA T TAA TCCTAGTTGTCCTGGAGGACTTGGAGTCACTGTCTG T TGGACTTACTTCA C 
CCA AACTGGTA TGTC TGA TGGGGGTGGA GTTCAAGA TCAGGCAAGAGAAAAACATGTAAAAGA A G TAA TC TC 
CCAACTC ACCCGGGTA CA TGGCA CCTCTAGCCCC TA C AAAGG A C TA GA TC TC TCA AAA C TA CA TGAAACCCT 
CCGTA CCCATA CTCGCCTGGTAAGCCTATT TAATACCACCCTCACTGGGCTCCATGAGGTCTC GGCCCAAAA 
CCCTACTAA CTGTTGGATATGCCTCCCCCTGAACTTCAGGCCATATGTTTCAATCCCTGTACC TGAACAATG 
GAA C AACTTCAGCACAGAAA TAAACA CCACT TCCG T T TTAGTAGGACCTCTT G T T TCCAA TC TGG AAA TAA C 
CCA TA CCTCA AA CCTCACC TGTGTAAAA TTTAGCAA TA C TA CA TA CA CAACC AAC TCCCAA TGCA TCAGGTG 
GGTAA CTCCTCCCA C AC AAA TAGTC TGCCTACCC TCA GG AA TA TTT TTTG TC TG TGG TA CCTCAGCCTA TCG 

ACAAGATTT ATACAf^TTA TGTCATATCTAAGCCCCGCA ACAAAAGAGTACCCATTCTTCCTTTTGTTATAGG 
A GCA GGAGTGCTAGG TGCACTAHG TACTGGCA TTGGC GG TA TC A CA A CCTCTACTCAGTTCTA C TACAAACT 
A TCTCAAGA A C.TAAA TGGGGA CA TGGAACGGGTCGCCGACTCCCTGGTCA CCTTGCAAGA TCAACTTAACTC 
CCTAGCAGC AGTAGTCCTTCAAAA TCGAAGAGCTTTAGA C TTGCTAACCGCTGAAAGAGGGGGAA CC TGTTT 
A TTTTTAGGGGAAGAA TGCTGTTA TTATGTTAA TCAA TCCGGAA TCGT CACTGAGAAAGTTAAAGAAA TTCG 
A GA TCGAA TA CA A CG TAGAGCA GA GGAGCTTC GAAACACTGGA CCCTGGGGCCTCCTCAGCCAA TGG A TGCC 
CTGGATTCTCCCCTTCTTAGGACCTCTAG CAGCTATAATATTnrTAnTCCTCTTTGGACC™'-" » — » » 



CCTCCTTGTTAACTTTGTCTCTTCCAGAA TCGAAGCTGTAAAACTA CAAA TGGAGCCCAAGA TC 

GACTAAGA TCT A CCGCAGAC CCCTGGACCGG C.CTGCTAGCCCACGA TCTGA TGTTAA TGACA TCAAAGGCAC 
CCCTCCTGAGGAAATCTCAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTVAGAGCGGTC 

TCCCCCrj\CCT^^^*^ & ^^ r ~^^ 

TTC CTAGGCTGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACCACAT CCACCTTTAAACACGGGGCTTG 
CAAC TTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGCTAATTA GGCAAAGACAGGAGGTAAAGAA 
ATAGCCAA TCATCTATTGCCTGAGAGCACAGCAGGAGGGACAATGATCGGGATAT AAACCCAAGTCTTCGAG 
rrfiflTAarKfirAAC CCCCTTTGGGTCCCCTCCCTTTGTATGGG AGCTCTGTTTTCATGCTATTTCACTCTAT 
T&aaTrTTr,r&A CTGCACTCTTCTGGTCCA TGTTTCTTACGGCTTGAGCTGAGCTTTCG C TCGCCATCCACC 
arTfyTfiTTTflnC GCCACCGCAGACCCGCCGCTGACTCCCATC CCTCTGGATCATGCAGGGTGTCCGCTGTG 
CTCCTGA TCCAGCGAGGCACCCATTGCCGCTCCCAATCGGGCTAAAGGCTTG CCATTGTTCCTGCATGGCTA 
AGTGCCTG GGTTCATCCTAATTGAGCTGAACACTAGTCACTGGGTTCCATGG TTCTCTTCTGTGACCCACAG 
CTTCTAA TAGAGCTATAACACTCACCGCATGGCCCAAGGTTCCATTCCTT GAATCCATAAGGCCAAGAACCC 
CAGGTCA GAGAACACGAGGCTTGCCACCATCTTGGGAGC TCTGTGAGCAAGGACCCCCAAGTAACACAACCA 
TGAGGGTGCAAATGCATGGGCCACTAATGGTAGAGCAAGAAAACAGAAGGGCCCTGGTTCCTCGAAGGCATC 
AGTGAGCTGAAATGCCTGCCCTGGATGTCCTATTCCTAGGTGTTTTTCTGCCTGAAGCAGATTAAACCCTTT 
GTTCACTTCTCCAAGTAGGGCTTCTATTACAGCCCAAATCAATCCCCACCCCAGATGACAT 
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FIGURE 2 
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ACTGAGAGACAGGACTAGCTGGATTTCCTAGGCCGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACC 

ACTGAGAGACAGGACTAGCTGGATTTCCTAGGCTGACTAAGAATCCCTAAGCCTAGCTGGGAAGGTGACC 
ACGTCCACCTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGC 

ACATCCACCTTTAAACACGGGGCTTGCAACTTAGCTCACACCTGACCAATCAGAGAGCTCACTAAAATGC 
TAATTAGGCAAAGACAGGAGGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACA 

TAATTAGGCAAAGACAGGAGGTAAAGAAATAGCCAATCATCTATTGCCTGAGAGCACAGCAGGAGGGACA 
ACAATCGGGATATAAACCCAGGCATTCGAGCTGGCAACAGCAGCCCCCCTTTGGGTCCCTTCCCTTTGTA 

ATGATCGGGATATAAACCCAAGTCTTCGAGCCGGCAACGGCAACCCCC-TTTGGGTCCCCTCCCTTTGTA 
TGGGAGCT — GTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 

TGGGAGCTCTGTTTTCATGCTATTTCACTCTATTAAATCTTGCAACTGCACTCTTCTGGTCCATGTTTCT 
TACGGCTCGAGCTGAGCTTTTGCTCACCGTCCACCACTGCTGTTTGCCACCACCGCAGACCTGCCGCTGA 

TACGGCTTGAGCTGAGCTTTCGCTCGCCATCCACCACTGCTGTTTGCCGCCACCGCAGACCCGCCGCTGA 
CTCCCATCCCTCTGGATCCTGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCGCCCATTGCCGCTCC 



CTCCCATCCCTCTGGATCATGCAGGGTGTCCGCTGTGCTCCTGATCCAGCGAGGCACCCATTGCCGCTCC 
CAATTGGGCTAAAGGCTTGCCATTGTTCCTGCACGGCTAAGTGCCTGGGTTTGTTCTAATTGAGCTGAAC 

CAATCGGGCTAAAGGCTTGCCATTGTTCCTGCATGGCTAAGTGCCTGGGTTCATCCTAATTGAGCTGAAC 
ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACGGCTTCTAATAGAACTATAACACTTACCACA 



ACTAGTCACTGGGTTCCATGGTTCTCTTCTGTGACCCACAGCTTCTAATAGAGCTATAACACTCACCGCA 
TGGCCCAAGATTCCATTCCTTGGAATCCGTGAGGCCAAGAACTCCAGGTCAGAGAATACGAGGCTTGCCA 



TGGCCCAAGGTTCCATTCCTTG-AATCCATAAGGCCAAGAACCCCAGGTCAGAGAACACGAGGCTTGCCA 
CCATCTTGGAAGC 



CCATCTTGGGAGC 
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IPMALPYHIFLFTVLLPSFTLTAPPPCRCMTSSSPYQEFLWRMQRPGNIDAPSYRSLSKG 

TPTFTAHTHMPRNCYHSATLCMHANTHYWTGKMINPSCPGGLGVTVCWTYFTQTGMSDGG 

GVQDQAREKHVKEVISQLTRVHGTSSPYKGLDLSKLHETLRTHTRLVSLFNTTLTGLHEV 

SAQNPTNCWICLPLNFRPYVSIPVPEQWNNFSTEINTTSVLVGPLVSNLEITHTSNLTCV 

KFSNTTYTTNSOCIRWVTPPTOIVCLPSGIFFVCGTSAYRCLNGSSESMCFLS FLVPPMT 

IYTEQDLYSYVISKPRHKRVPILPFVIGAGVLGALGTGIGGITTSTQFYYKLSQELNGDM 

ERVA DSLVTLQDQIjNSIJUWVLQNRRAIiDLLTAERGGTCLFLGEECCYYVNQSGIVTEKVKEIRDR 

NTGPWGLLS QWMPWILPFLGPIAAI ILLLLFGPC I FNLLVNFVS SRIE AVKLQME PKMQ SKTKI YRRPLDRPAS P 

RSDVNDIKGTPPEEISAAQPLLRPNSAGSS 
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1 ) NSLAAWLQNRRALDLLTAESGGT FLFLEEKC 

2 ) NSLAAWLQNRRALDLLTAERGGTCLFLGEEC 

3 ) DSLAAVTLQNHQGLDLLTAEKGGLCYFLGEDC 

4 ) DSLAAVTLQNHQGLDLLIAEKGGLCTFLGEEC 

5 ) DSLAAVTLQNCRGLDLLTAEKGGHYTFLGEEC 
6} LQNRRGLDLLFLKEGGLC 

7 ) DSLAKVVLQNRRGLDLLTAEQGGICLALQEKC 
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TSFVEKANGVKCHKYKLSFHXETTH^^YW 

ANIPQLXPLQAVGGREFGPARVHVPFSLPDLKQIKTDLGKFSDNPDGYIDVLQGLGQFFDLTWRDIMSLLNQTLTPNER 

SATITAAXEFGDLWYLSQVlsroRMTTEEREXFPTGQ 

MSTITQGREENPTAFLERLREAIiRKRASLSPDSSEGQLILK^KFI^^ 

NRDQEEQAEQDKRDXKKGHRFSHDPQASGLWRLWKREKLGKLNAXXGL^ 

LEGFLPOGTKVLXVRSHXPD / S S S RT 
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CCTGGCACTCCTGAGGGAAGTATAAATTATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGGCA 

CCTGGC-CTCCTGAGGGAAGTATAAATTATAACACCATCTTACAGCTAGACCTCTTTTGTAGAAAAGAAG 
-CAAATGGAGTGAAGTGCCATAAGTACAAACTTTCTTTTCATTAAGAGACAACTCACAATTATGTAAAAA 

GCAAATGGAGTGAAGTGCCATATGTACAAACTTTCTTTTCATTAAGAGATAACTCCCAATTATGTAAAAA 
GTGTGATTTATGCCCTACAGGAAGCCTTCAGAGTCTACCTCCCTATCCCAGCAT--CCCCGACTCCTTCC 

GTGTGATTTATGCCCTACAGGAAGCCCTCAGAGTCTACCTCCCGACCCCAGCAAGACCCCAACTCCTTCT 
CCAACTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAAGGGTAAACAGTGAAC 

CCAACTAATAAGGACCCCCCTTCAACCCAAATGGTCCAAAAGGAGATAGACAAAGGGGTAAACAATGAAC 
CAAAGAGTGCCAATATTCCCCAATTATGACCC-CTCCAAGCAGTGGGAGGAAGAGAATTCGGCCCAGCCA 

CAAAGAGTGCCAATATTACACGATTAT-ACTCGCTCCAAGCAGTGGGAGGA-GA-ATTT-GGCCCAGCCA 
GAGTGCATGTGCCTTTTTCTCTCCCAGACTTAAAGCAAATAAAAACAGACTTAGGTAAATTCTCAGATAA 

GCGTGCATGTACCTTTTTCTCTCTCAGATTTAAAGCAAATTAAAATAGACCTAGGTAAATTCTCAGATAA 
CCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGACAATTCTTTGATCTGACATGGAGAGATATAATG 

CCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGACAATCCTTTGATCTGACATGGAGAGATATAATG 
TCACTGCTAAATCAGACACTAACCCCAAATGAGAGAAGTGCCACCATAACTGCAGCCTGAGAGTTTGGCG 

TTACTGCTAAATCAGACACTAACCCCAAATGAAAAAAGTGCTGCCATAACAGCAGCCTGAGAGTTTGGCG 
ATCTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGAGGAAAGAGAATGATTCCCCACAGGCCA 

AACTCTGGTATCTCAGTCAGGTCAATGATAGGATGACAACAGATGAAAGAGAATGATTCCCCACAGGCCA 
GCAGGCAGTTCCCAGTCTAGACCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCTGCAGACAT 



GCAGGCAGTTCCCAGTGTAGACCCTCATTAGGACACAGAATCAGAACTTGGAGATTGGTGCCACAGACAT 
TTGCTAACTTGTGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGTCTATGAATTACTCAATGATGTCCA 

TTGCTAACTTGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGCCCATGAATTATTCAATGATGTCCC 
CCATAACACAGGGAAGGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAGGAAGCG 

CT AT AAC AC AG GG AAAGGAAG AAAAT C CT AC TGC C TTT C T GG AG AG AC T AAGGG AAGG AT TG AG G AAGC A 
TGCCTCTCTGTCACCTGACTCTTCTGAAGGCCAACTAATCTTAAAGCGTAAGTTTATCACTCAGTCAGCT 

TACCTCCCTGTCACCTGACTCTATTAAAGGCCAACTAATCTTAAAGGATAAGTTTATCACTCAGTCAGCT 
GCAGACATTAGAAAAAAACTTCAAAAGTCTGCCGTAGGCCCGGAGCAAAACTTAGAAACCCTATTGAACT 

GCAGAGATTAAGAAAAAACTTCAAAAGTATGCCTTAGGCCCAGAGCAAAACTTAGAAACCCTACTGAACT 
TGGCAACCTCGGTTTTTTATAATAGAGATCAGGAGGAGCAGGCGGAACAGGACAAACGGGATTAAAAAAA 

TGGCAACCTCAGTTTTTTATAATAGAGATCAGGAAGAGCAGG-GGAATGGGACAAATGGGATAAAAAAAA 
A GGCCACCGCTTTAGTCATGACCCTCAGGCAAGTGGACTTTGGAGGCTCTGGAAAAGGGAAAA 

AAAAAAAAGGTGACTGCTTTAGTCGTGGCCCTCAGGCAAATGGACTTTGGAGGCTCCAGAAAAGGGAAAA 
GCTGGGCAAATTGAATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTG 



GCTGAGCAAATTGAATGCCTAACAGGGCTTGCTTCTAGTGTGGTCTACAAGGACACTTTAAAAAAGATTG 
TCCAAGTAGAAGTAAGCCGCCCCCTCGTCCATGCCCCTTATTTCAAGGGAATCACTGGAAGGCCCACTGC 

TCCAAGTAGAAACAAGCTGCCCCCTTGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACTGC 
CCCAGGGGACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGATCCAGCAGCAGGACTGAGGGTGCC 

CCCAGGAGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATAATCCAGCAGCAGGACTGAGGATGCC 
TGGGGCAAGCGCCATCCCATGCCATCACCCTCACAGAGCCCTGGGTATGCTTGACCATTGAGGGCCAGGA 



CAGGGCAAGCGCCAGCCCATGCCATCACCCTCACAGAGCCTTGGGTATGCTTGACCATTGAGGGCCAGGA 
GGTT GTCTCCTGGACACTGGTGCGGTCTTCTTAGTCTTACTCTTCTGTCCCGGACAACTGTCCTCC 

GGTTCACTGTCTCTTGGACACTGGTATGGCCTTCTCAGTCTTACTCTCCTGTCCTGGACAACTGTCCTTC 
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01/ TAAATCCCCATGGCCCTCCCTTATCATATTTTTCT 

02/ TAAATCCCC-TGGCCCTCCCTTATCATATTTTTCT 

03/ TAAATCCCCATGGCCCTCCCTTATCATATTTTTCT 

04 / TAGATCCTCATGGCCCTCC-TTGTCATATTTTTTT 



01/CTTTACTGTTCTTTTA-CCCTCTTTCACTCTCACTGCACCCCCTCCATGCCGCTGTATGACC 
02/CTTTACTGTTCTCTTACCCCCCTTTCACTCTCACTGCACCCCGTCCATGCCACTGCACCCCC 
03/CTTTACTGTTCTCTTA-CCCCCTTTCTCTCTCACTGCACCCCCTCCATGCTGCTGTACAACC 
04/CTTTACTGTTCTCTTA-CCCCCTTTCACTCTCACTGAACCCCCTCCATGCCACTGTACTACC 

0 1 /AGT AGCTCCCCTTACCAAGAGTTTCTATGGAGAATGCAGCGT 

02/GTCCATGCCCGTCTCATGCCAGTAGCTCCCCTTAGCAAGAGTTTCTATGGAGAATGCAGCGT 

03/AGC AGCTCCCCTTACCAAGAGTTTCTATGAAGAATGCGGCTT 

04 /AGT AGCTCCCATTACCAAGAGCTTCTATGGACAATGCGGCTT 

0 1 /CCCGGAAATATTGATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGC 
02/CCCGGAAATATTGATGCCCCATTGTATAGGAGTTTATCTAAGGGAACCCCCACCTTCACTGC 
0 3 /CCC AGAAATATTGATGCCCCATCAAATAGG AGT TTACCTAAAGGAAACTCC AC CTTC ACT GC 

0 4 /CCTGGAAATATTGATGACCCATCGTATAGGAGTTTTTCTAAAGGAAACCCCATTTTCACCAC 

01/CCACACCCATATGCCCCGCAACTGCTATCACTCTGCCACTCTTTGCATGCATGCAAATACTC 
02 /CC AC ACCCATATGCCCC AC AACTGCT AT AACTCTGCC ACT CTTTGCATGC AT GCAAAT AC TC 
03/CCACACCCATATGCCCCACAACTGCTATAACTCTGCCACTCTTTGCATGCATGCAAATACTC 
04 /CCACACCTATATGACCC 

0 1 /ATTATTGGACAGGAAAAATGATTAATCCTAGTTGTCCTGGAGGACTTGGAGTCACTGTCTGT 

02/ATTATTGGACAGGAAAAACGATTAATCCCAGTTGTCCTGGAGGACTTGGAG 

03/ATTATTGGACAGGGAAAATGATTAATCCTAGTTGTCCTGGAAGACTTGGAGCCACTGTCTGT 
04/ 

01/TGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAGTTCAAGATCAGGCAAGAGA 
02/ — GACTCACTTCACTCATACCAGTATGTCTGATGGGGGTGGAGTTCAAGATCAGGCAACAGA 
03/CGGACTTACTTCACCCATACTGGTATGTCTGAGGGGGGTGGAGTTCAAGATCAGGCAAGAGA 
04/ 

0 1 / AAAACATGTAAAAGAAGTAATCTCCCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACA 
02/AAAACACATAAAGGAAGTAATCTCCCAACTGACCTGGGTACATAGCACCCCTGGCCCCTACA 

0 3 / AAAACATGTAAAGGAAGTAACCTCCCAACTGACCCGGGTACATAGCACCCCTAGCCCCTACA 
04/ 

0 1 /AAGGACTAGATCTCTCAAAACTACATGAAACCCTCCGTACCCATACTCGCCTGGTAAGCCTA 
02/AAGGACTAGATCTCTCAAAACTACATGAAACCCTCCATACCCATACTGGCCTGGTAAGCCTA 
03/AAGGACTAGATCTCTTAAAACTACATGAAACCCTCCATACCCATACTTGCCTGGTAAGCCTA 
04/ 

0 1 /TTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACT AACTGTTGGAT 
02/TTTAATACCACCCTGACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGAT 
03/TTTAATACCACCCTCACTGGGCTCCATGAGGTCTCGGTCCAAAACCCTACTAACTGTTGGTT 
04/ 

0 1 /ATGCCTCCCCCTGAACTTCAGGCCATATGTTTCAATCCCTGTACCTGAACAATGGAACAACT 
02/GTGCCTCCCCCTGCACTTTAGGCCATACATTTCAATCCCTATACCTGAACAATGGAACAACT 
03/GTGCCTCCCCCTGTATTTCAGGCCATGCATTTCAATCCCTGTACCTGAACAATGGAACAACT 
04/ TGCACTTCAGGCCATACATTTCAAT CCCTGTA 
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01/TCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCCAATCTGGAAATA 

02/TCAGCACAGAAATAAACACCACTTCTGTTTTAGTAGGTCCTC TTTCCAATCTGGAAATA 

03/ACAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCTCTTGTTTCC71ATCTGGAAATA 



01/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTACATACACAACCAACTCCCA 
02/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTATAGACACAGCCAACTCCCA 
03/ACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTGTAGACACAACCAACTCCCA 
04/ 

01/ATGCATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
02/ATGCATCAGGTGGGTAACTCCTCCCACACGAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
03/ATGCATCAGGTGGGTAACTCCTCCCACACGAATAGTCTGCCTACCCTCAGGAATATTTTTTG 
04/ 

01/TCTGTGGTACCTCAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCA 
02/TCTGTGGTACCTCAGCCTATCATTGTTTGAATGGCTCTTCAGAATCTGTGTGCTTCCTCTCA 
03/TCTGTGGTACCTTAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCA 
04/ 

0 1 / T T C T TAG T GC C C CC TAT G AC CAT C T AC AC T G AACAAG AT T T AT AC AG T TAT G T CAT AT C T AA 
0 2 / T T C T TAG T G G C C C C TAT G C C CAT C T AC AC T G AAC AAG AT T T AT AC AAT CAT G T CAT AC C T AA 
03/TTCTTAGTGCCCCC-ATGACCATTTACACTGAACAAGATTTATACAATTATGTTGTACCTAA 
04/ 

01/GCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATAGGAGCAGGAGTGCTAGGTGCAC 
02/GCCCCGCAACAAAAGAGTACCCATTCTTCCTTTTGTTATTGGAGCAGGAGTGCTAGGCGGAG 
03/GCCCCACAACAAAAGAGTACTCATTCTTCCTTTTGTTATCGGAGCAGGAGTGCTAGGTGGAC 
04/ 

01/TAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGAA 
02/TAGCTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACAAACTGTCTCAAGAA 
03/ TAGGTTCTGGCATTGGCGGTACCACAACCTCTACTCAGTTCTACTACAAACTATCTCAAGAA 
04/ 

01/CTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTC 
02/CTTAAAGGTGACATGGAATGGGTCGCTGATACCCTGGTCACCTTGCAAGATCAACTTAACTC 
03/CTCAATGGTGACATGGAATGGGTTGCCGACTCCCTGGTCACCTTGCAAGATCAACTTAACTT 
04/ 

0 1 /CCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGG 
02/CCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCGGAAAGCGGGG 
0 3 / C C TAG CAT C AG TAG T CC T T C AAAAT T G AAG AGC T T TAG AC T T G C T AAC C T C T G AAAG AG G G G 
04/ 

01/ GAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTT 

02/GAACCTTTTTATTTTTAGAGGAAAAATGCTGTTGTTATGTT 

03/GAAGCTGTTTATTTTTAGGGGAAGAATGTTGTTATTATGTTATTTTAGCGGAAGAATGTTGT 
04/ 

01/ AATCAATCCGGAATCGTCACTGAGAAAGTTAAAGAAATTCGAGATCGAATACA 

02/ AAT C AATC C G G AAT CAT CACC GAG AAAG T T AAAG AAAT T C AAG G T C G AAT AT A 

03/TATTATGTTAATCAATCCTGAATTGTCACAGAGAAAGTTGAAGAAATTCGAGATTGAATACA 
04/ 

01/ACGTAGAGCAGAGGAGCTTCGAAA-CACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
02/ACGTAGAGCAAAGGAGCTGCAAAA-CACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
03/ACGTAGAACAGAGGAGCTTCAAAAACACCAGACCCTGGGGCCTCCTCAGCCAATGGATGCCCT 
04/ 
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01/GGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTTGGACCCTGTA 
02/GGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGTTACTCCTCTTTGGACCCTGTA 
03/GGATTCTCCCCTTCTTAGGATCTCTAGCAGCTCTAATATTGATACTCCTCTTTGGACCCTGTA 
04/ 

0 1 /TCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAGCTGTAAAACTA 

02/TCTTTAACCTCCTTGTTAAGTTTGTCTTTTCCAGAATCGAAGCAGTAAAACTACAAATCGTTC 
0 3/TCTTTAACCTCCTTGTTAAGTTTGTCTCTTCCAGAATCAAAGTTGTAAAGCTACAAATCGTTC 

0 4/TCTTTAACCTCCTTGTTAAGCTTGTCTCTTGCAGAATCGAAGCTGTAAAACTACAAATGCTTG 

01/ — C AAAT GG AG C C C AAG AT G C AG T C C AAG AC T AAG AT C T AC C G C AG AC C C C T G G AC C G G C C T G 
02/TTCAAATGGAGCCCCAGATGCAGTCCATGAGTAAAATCTACCACGGACCCCTGGACCGGCCTG 
03/TTCAAATGGAACCCCAGATGAAGTCCATGACTAAGATCTACCGTGGACCCCTGGACCGGCCTA 
04/TTAAAATAGAGCCCCAGATGCAGTCCATGGCTAAGATCTACCACGGACCCCTGGACCGGCCTG 

01/CTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAAATCTCAGCTGCAC 
02/CTAGCCCATGCTCTGATGTTAATGACATC7VAAGGCACCCCTCCCGAGGAAATCTCAACTGCAC 
03/CTAGCCCATGCTCCAATTGTAATGATATCGAACGCACCCCTCCCGAGGAAATCTCAACTGCAC 
04/CTAGCCCATGCTCTGATGTTGATGACATTGAAGGCACGGCTTCCGAGGAAATCTCAACTGCAC 

0 1 /AACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCC 
02/AACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGTGGTTGTTGGCCAACCTCCCC 
03/AACCCCTACTATGCCCCAATTCCGCAGGAAGCAGTTAGACTGGTCGTCAGCCAACCTCCCC 

04/GACCCCTACTACACCCCAATTTAGCGGGAAGCAATTAGAGCAGCCTATGGCCACCTCCCC 
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CTTCCCCAACTAATAAGGACCCCCCTTTCAACCCAAACAGTCCAAAAGGACATAGACAAAGGA 3 

CTTCCCCAACTAATAAGGACCCCCCTTTCAACCCAAACAGTCCAAAAGGACATAGACAAAGGA 4 

CTTCCCCAACTAATAAGGACCCCCC-TTCAACCCAAATGGTCCAAAAGGAGATAGACAAAAGG 5 

C T T C T C C AAC T AAT AAG G AC CCCCC-TT C AAC C C AAAT GG T C C AAAAG GAG AT AG AC AAAG G G 6 

CTTCCCCAAATAATAAGAACCCCCC-TTCAACCCAAACGGTCCAAAAGGAGATAGACAAAGGG 7 

GTAAACAATGAACCAAAGAGTGCCAATATTCCCTGGTTATGCACCCTCCAAGCGGTGGGAG — 3 

GTAAACAATGAACCAAAGAGTGCCAATATTCCCTGGTTATGCACCCTCCAAGCGGTGGGAG — 4 

GTAAACAGTGAACCAAAGAGTGCCAATATTCCCCAATTATGACCCCTCCAAGCAGTGGGAGGA 5 

GTAAACAATGAACCAAAGAGTGCCAATATTACACGATTATACTCGCTCCAAGCAGTGGGAG — 6 

GTAAACAACTAACCAAAGAATGCCAATATTCCCCGATTATGCCCCCTCCAAGCGGTGGGAG — 7 

A-AGAATTCGGCCCAGCCAGAGTGCATGTACCTTTTTCTCTCTCAC-ACTTGAAGCAAATTAAA 3 

A-AGAATTCGGCCCAGCCAGAGTGCATGTACCTTTTTCTCTCTCAC-ACTTGAAGCAAATTAAA 4 

AGAGAATTCGGCCCAGCCAGAGTGCATGTGCCTTTTTCTCTCCCAG-ACTTAAAGCAAATAAAA 5 

-GAGAATTTGGCCCAGCCAGCGTGCATGTACCTTTTTCTCTCTCAG-ATTTAAAGCAAATTAAA 6 

-GAGAATTCGGCCCAGCCAGAGTGCACGTACCTTTTTCTCTCTCTAGACTTTAAA TTAAA 7 

ATAGACNTAGGTNAATTNTCAGATAGCCCTGATGGYTATATTGATGTTTTACAAGGATTAGGA 3 

ATAGACXTAGGTXAATTXTCAGATAGCCCTGATGGXTATATTGATGTTTTACAAGGATTAGGA 4 

ACAGACTTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGA 5 

ATAGACCTAGGTAAATTCTCAGATAACCCTGATGGCTATATTGATGTTTTACAAGGGTTAGGA 6 

ATAGACCTAGGTAAATTCTCAGATAACCCTAATGGCTATATTGATGTTTTACAAGGTTTAGGA 7 

TTCCTGAGTTCTTGCACTAACCTCAAAT 1 

CAATCCTTTGATCTGACATGGAGAGATATAATATTACTGCTAAATCAGACGCTAACCTCAAAT 3 

CAATCCTTTGATCTGACATGGAGAGATATAATATTACTGCTAAATCAGACGCTAACCTCAAAT 4 

CAATTCTTTGATCTGACATGGAGAGATATAATGTCACTGCTAAATCAGACACTAACCCCAAAT 5 

CAATCCT T TGAT CTGAC AT GG AG AGAT AT AAT GTTACTG CT AAATC AG AC AC TAACCCC AAAT 6 

CAATCCTTTGATCTGATATGGAGAGATATAATGTTACTGCTAAATCAGACACTAACCCCAAAT 7 

GAGAGAAGTGCCGCCATAACTGCAACCCAAGAGTTTGGCGATCCCTGGTATCTCAGTCAGGTC 1 

GAGAGAAGTGCTGCCATAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 3 

GAGAGAAGTGCTGCCATAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 4 

GAGAGAAGTGCCACCATAACTGCAGCCTGAGAGTTTGGCGATCTCTGGTATCTCAGTCAGGTC 5 

GAAAAAAGTGCTGCCATAACAGCAGCCTGAGAGTTTGGCGAACTCTGGTATCTCAGTCAGGTC 6 

GACAGAAGTGTCGCCGTAACTGGAGCCCGAGAGTTTGGCAATCTCTGGTATCTCAGTCAGGTC 7 

AATGACAGGATGACAACAGAGGAAAGATAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 1 

AATGATAGGATGACAACGGAGGAAAGAGAACGATTCCCCACAGGGCAGCAGGCAGTTCCCAGT 3 

AATGATAGGATGACAACGGAGGAAAGAGAACGATTCCCCACAGGGCAGCAGGCAGTTCCCAGT 4 

AATGATAGGATGACAACAGAGGAAAGAGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 5 

AATGATAGGATGACAACAGATGAAAGAGAATGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 6 

AATGATAGGATGACAACAGAGGAAAGAGAACGATTCCCCACAGGCCAGCAGGCAGTTCCCAGT 7 

GTAGACCCTCATTAGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTGCTAACT 1 

AACT 2 

GTAGCTCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCCGCAGACATTTACTAACT 3 

GT AG CTCCTC AT T G GG ACACAGAATC AGAAC AT GG AG AT TGGTGCCGCAG AC AT TT 4 

CTAGACCCTCATTGGGACACAGAATCAGAACATGGAGATTGGTGCTGCAGACATTTGCTAACT 5 

GTAGACCCTCATTAGGACACAGAATCAGAACTTGGAGATTGGTGCCACAGACATTTGCTAACT 6 

GT AG ACCCTCACTGGGACACAGAATC AG AAC AT GG AG ATT GGTGCCGC AG AC ATT TGCT AACT 7 
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TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA TATGAATTATTCAATGATGTCCACT 1 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA CTATGAATTATTCAATGATGTCCACT 2 

TGCGTGCTAGAAGGACTAAGGAAAACTAGGAAGA CTATGAATTATTCAATGATGTCCACT 3 

TGTGTGCTAGAAGGACTAAGGAAAACTAGGAAGAAGTCTATGAATTACTCAATGATGTCCACA 5 

TGCGTGCT AG AAGG ACT AAGGAAAACT AG GAAGAAGCCCATGAATT AT TCAATG AT GTCCCCT 6 

TGCGTGCTAGAAGGACTAAGGAAAACTAGAAAGAAGCCTGTGAGTTATTCAATGATGTCCACT 7 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 1 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 2 

ATAACACAGGGGAAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 3 

ATAACACAGGG-AAGGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAGGCATTGAG 5 

ATAACACAGGG-AAAGGAAGAAAATCCTACTGCCTTTCTGGAGAGACTAAGGGAAGGATTGAG 6 

ATAACACAGGG-AAAGGAAGAAAATCCTACCGCCTTTCTGGAGTGACTAACGGAGGCATTGAG 7 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGAAAAGTA 1 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGCAAATTG 2 

GAAGCATACC AGGCAAGTGGACATTGGAGGCTCTGGAAAAGGGAAAAGTTGGGCAAATTG 3 

GAAGCGTGCC232AGGCAAGTGGACTTTGGAGGCTCTGGAAAAGGGAAAAGCTGGGCAAATTG 5 

GAAGCATACC238AGGCAAATGGACTTTGGAGGCTCCAGAAAAGGGAAAAGCTGAGCAAATTG 6 

GAAGCATACC2 3 3 AGGCAAGCGGACTTTGGAGGCACTGGAAAAGGGAAAAGCTAGGCAAATCA 7 

TATGTCTAATAGGGCTTGCTTCCAGTGTGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 1 

AATGCCTAATAGGGCTTGCTTCCAGTGCAGTCTACAAGGACGCTTTAGAAAAGATTGTCC-AA 2 

AATGCCTAA 3 

AATGCCTAATAGGGCTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 5 

AATGCCTAACAGGGCTTGCTTCTAGTGTGGTCTACAAGGACACTTTAAAAAAGATTGTCC-AA 6 

AATGCCTAATAGGGTTTGCTTCCAGTGCGGTCTACAAGGACACTTTAAAAAAGATTGTCCAAA 7 

-TAGAAATAAGCCACCACCTCGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACT 1 

GTAGAAATAAGCCGCCCC-TCGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCTACT 2 

GTAGAAGTAAGCCGCCCCCTCGTCCATGCCCCTTATTTCAAGGGAATCACTGGAAGGCCCACT 5 

GTAGAAACAAGCTGCCCCCTTGTCCATGCCCCTTATGTCAAGGGAATCACTGGAAGGCCCACT 6 

- T AGAAAT AAGCCGCCC C CTCGTCC AT GC AC CTCGTGTCAAGGGAATC ACT GTAAGGCCC ACT 7 

GCCCCAGGGGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 1 

GCCCCAGGGGACGAAGGTCCTCTGAGTCAGAAGCCACTAACCTGATGA 2 

GCCCCAGGGGACAAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 5 

GCCCCAGGAGATGAAGGTCCTCTGAGTCAGAAGCCACTAACCAGATAA 6 

GCCCCAGGGGACGTAGGTCCTCTGAGTCAGAAGCCACTAACCAGATGA 7 
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RTPLSTQTVQKDI DKGVNNEPKSANIPWLCTLQAVGEEFG PARVHVPFSLSHLKQI KI DG SDSPSG 
KDPPSTQMVQKEIDKRVNSEPKSANI PQLPLQAVGGREFGPARVHVPFSLPDLKQIKTDLGKFSDNPCG 
YIDVLQGLGQSFDLTWRDIILLLNQTLTSNERSAAITGAREFGNLWYLSQVNDRMTTEERERFPTGQQ 
YIDVLQGLGQFFDLTWRDIMSLLNQTLTPNERSATITAJIXEFGDLWYLSQVNDRMTTEEREXFPTGQQ 
AVPSVAPHWDTESEHGDWCRRHLLTCVLEGLRKTRK TMNYSMMSTITQGK 
AVPSLDPHWDTESEHGDWCCRHLLTCVLEGLRKTRKKSMNYSMMSTITQGR 
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GTCTACCTAGCCA-AGGCATATTCTTCTTATGTGGAACATCAACCTATATCTGCCTCCCCACTAAC'TGGA 

GTCTGCCTACCCTCAGGAATATTTTTTGTCTGTGGTACCTCAGCCTATCGTTGTTTGA — A-TGGCTCTT 
CAGGCACC-TGAACCTTAGTCT--TTCTAAGTCCCAAC-ATTAACATTGCCCCAGGAAATCAGACCC-TA 

C AGAATCT AT GTGC- TTCCT CTC ATTCTT AG TGCCCCC TATGACCATCT AC ACT GAAC A- - AG ATTT AT A 
TTGGTACCTGTCAAAGCTAAAGTCCCGTCAGTGCAGAGCCATACAACTAATATCCCTAT-TTATAGGGTT 

CAGTTA — TGTCATATCTAA-GCCCCGCAACAAAAGAGT-ACCCAT-TC-T-TCCTTTTGTTATAGGAGC 
AGGAATGGCTAC-TGCTAC-AGGAACTGGAATAGCCGGTTTATCTACTTC-ATT-A-TCCTACTACCATA 

AGGAGTG-CTAGGTGC-ACTAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTACTACA^-A 
CACTCTCAAAGAATTTCTCAGACAGTTTGCAAGAAATAATGAAATCT ATTCTT ACTTTACAATCCCAA-T 

CTATCTCAA-GAACTAAATGGGGACATGGAACGGGTCGCCGAC-TCCCTGGTCACCTTGCAAGATCAACT 
TAGACTCTTTGGCAGCAAT-GACTCTCCAAAACCGCCGAGGCCCACACCTCCTCACTGCTGAGAAAGGAG 

TA-ACTCCCTAGCAGCAGTAGTC-CTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGG 
GACTCTGCACCTTCTTAGGGGAAGAGTGTTGTTTTTACACTAACCAGTCAGGGATAGT-AC-GAGAT-GC 

GAACCTGTTTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCAATCCGGAATCGTCACTGAGAAAGT 
CACCTGGCATTT-ACAGGAAAGGGCTTCTGATATCAGACAATGCCTTTCAAACTCTTATACCAA CCT 

TAAA-GAAATTCGAGATCGAATA-CAACGTAGAGCAGAGGA-GC-TTCGAAACACTGGACCCTGGGGCCT 
CTGGAGT TGGGCAACATGGCTTCTTCCATTTCTAGGTCCCATGGCAGCCATCTTGCTGTTACTCACC 

CCTCAGCCAATGGATGCCCTGGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTC 
TTTGGGCCCTGTATTTTTAAGCTTCTTGTCAAATTTGTTTCCTCTAGGATCGAAGCCATCAAGCTACAGA 



TTTGGACCCTGTATCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAGC — T G-TAAA-A 

TGGTCTTACAAATGGAACCCCAAATG-AGTTCAACTAACAACTTCTACCAAGGACCCCTGGAACGATCCA 

CT-ACAAATGGAGCCCAAGATGCAGTCCAAG-ACTAAGATCTACCGCAGACCCCTGGACCGGCCTG 

CTGGC — ACT-TCC-AC-T-A — GCC-T-AGAGATTCCCCTCTGGAAGACA-CTACAACTGCAGGGCCCC 

CTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAAATCT-CAGCTGCACAACCTC 
TTCTTTGCCCCTATCCAGCAGGAAGTAGCTAGAGCGGTCATCGGCCAAATTCCC-AACAGCAGTTGGGGT 



TACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCCAACAGCACTTAGGTT 
GTCCTGTTTAGAGGGGGG 



TTCCTGTTGAGATGGGGG 
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ACCTTGCAAGATCAACTTA-ACTCCCTAGCAGCAGT-AGTCCTTCAAAATCGAAGAGCTTTAGACTTGCT 



ACTTTACAATCCCAAATAAGACTCTTTGGCAGCAGTGACTC - TCCAAAACCGCTGAGGCCTAGATCTCCT 
AACCGCTGAAAGAGGGGGAACCTGTTTATTTTTAGGGGAAGAA.TGCTGTTATTATGTTAATCAATCCGGA 



CACTGCTGAAAAAGGAGGACTCTGCACCTTCTTAGGGGAAGAGTGTTGTTTTTACACTAACCAGTCAGGG 
ATCGTCACTGAGAAAGTTAAAGAAATTCGAGATCGAATA- - CAACGTAGAGCAGAGGAGCTTCGAAACAC 

ATAG- CA - TGAGAT - GCCACCCAGCGTTTACAG - GAAAAGGCTTCTGAAATCAGACGCCTTTC - AAATTC 
TGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCTGGATTCTCCCCTTCTTAGGACCTCTAGCAGCTATA 



TTATACCAA CCTCTGGAGT TGGGCAACATGGCTTCTCCCCTTTCTAGGTCCCGTGGCAGCCATC 

ATATTGCTACTCCTCTTTGGACCCTGTATCTTTAACCTCCTTGTTAACTTTGTCTCTTCCAGAATCGAAG 



TTGCTGTTACTCGCCTTTGGGCCCCGTATTTTTAACCTTCTTGTCAAATTTGTTTGGTCTAGAATCGAGG 
C - - T G-TAAA-A CT - ACAAATGGAGCCC AAGATGCAGTC C AAG - ACTAAGATCTACCGC AG AC 



CCATCAAGCTACAGATGGTCTTACAAATCGAACCCCAAATG - AGTTCAACTAACAACTTCTACCGAGGAC 
CCCTGGACCGGCCTGCTAGCCCACGATCTGATGTTAATGACATCAAAG-GCACCCCTCCTGA-GGAAATC 



C CCTGGACTGAC C AG CTGGC - - ACT - TCCCCTG GCC - T - AGAGAGTTCCCCTC - TGAAGGACA - C 

T-CAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCC 



TACAACTGCAAAGCCCCTTCTTCGCCCCTATCCAGCAGGAAGTAGCTAGAGCAGTCATCGGCCAAATTCC 
CCAACAGCACTTAGGTTTTCCTGTTGAGATGGGGG 



C - AACAGCAGTTGGGGTGTCCTGTTGAT - TGAGGG 
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agttgcaattccttgcctcaactctgagagaaaccccagccacatctccagcaaacaaga 

II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 III 1 1 1 1 1 1 1 1 1 1 I II I I I 1 1 I 1 1 1 1 1 i I I I 1 1 1 I I 

agttgcaattccttgcctccactgtgagacaaaccccagacacatctccagcacacaaga 2 2 99 
acttcaaaacacctgaactgcagcagccaggcgttcctccaggaccacctcccccaggat 

1 1 1 ii 1 1 1 1 1 1 1 1 1 mi 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 

acttcgaaatgcctcaacctcaggtgccaggggttcctccagaaccttctcccccaggag 2 3 59 
cttgcttcaagtgccggaaatctgaccattgggccaaggaatgcctgcagcccaggantc 

MINI I I 1 1 1 II I 1 1 1 1 1 1 1 1 III 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 I 

cttgctacaagtgccagaaatctggccactgggccaaggaatgcccacagaccaggattc 2419 
ctcctaagccacgtcccatttgtgcaggaccccactggaaatcggactgtccaactcacc 

MINIMI MUM III IIIIIMIII I I II I I I II II II I II II M 

ctcctaagctgtatcccatctctgtgggaccccactaaaaatcagactgttcaactcacc 24 7 9 
cggcagccaatcccagagcccctggaactctggcccaaggctctctgactgactccttcc 

IMMIII I 1 1 1 1 1 1 1 1 II I II ! 1 1 II I II I 1 1 II II I I 1 1 II I II II I Mill 

tggcagccacttccagagcccctggaactctagcccaaggctctctgactgaccccttct 253 9 
cagatcttctcggcttagcagctgaagactgacactgcccgatcacttcagaagtcccct 

MINIM I E 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 f 1 1 ! I i I MM I II MM I I 

gagatcttcttggcttagcagctgaagactgacactgccagatcgcctcggaagcctaca 2 5 99 
ggaccatcacggatactgagcttcaggtaactctcacagtggaggctaagtccatcccct 

I I II I I I I I I I II II I II 1 1 1 I II I 1 1 M II II MM II II 1 1 I I II 1 1 

ggaccatcacagat gctccaggtaactctcacagtagagggtaagcctigtcccct 2 6 54 

gtttaatcgatacaggggctacccactccacatcaccttcttttcaagggcctgtttccc 

I II II I Ml I 1 1 1 1 1 1 II 1 1 ! II II I I I II M II II I II 1 1 II II I II II I 

tcttaatcaatatggaggctacccactgcacattaccttcttttcaagggcctgtt tcct 2714 
tttcccccataactgttgtgggtattgacggccaagcttcaaaaccccttaaaactcccc 

II II II I II I II I 1 1 1 1 II I II 1 1 1 M II I II Mill Mill i I F ! 1 1 1 I I i t 1 I 

ttgcctccataactgttgtgggtattgacggccaggcttctaaacctcttaaaactcccc 2 7 74 
cactctggtgccaacttggacaacattcttttatgcactctttttcagttatcctcacct 

Mill II IMMM Mill I 1 1 f I 1 1 ! INN MM MIMIM III I 

aactctagtaccaacttagacaatactcttttaagcactcctttttagttatccccactt 2 8 34 
gcccagttcccttattaggccgagacattttaaccaaattatctgcttccccgactattc 

I I I M I I 1 1 1 1 1 M I MIIMIMM II Ml I I II 1 1 1 1 1 II 1 1 1 II IMMIII 

gcccagttcccttatgaggccgagacacttcaactaaattatctgcttccctgactattc 2 8 94 
ctgggctacagccacatctccttgccgcccttcttcccaacccaaagcctccttcatatc 

MM lllllll IMMM MM I I I M I II I M I ! I IIIIIIIIIMII III 

ctggactacagctacatctcattgctgcccttcttcccaatccaaagcctcctttgcatc 2 9 54 
ttcctctcatatccccccaccttaacccacaagtatgggacacctctactccctccctgg 

III I I lllllll IIIIIIIIIIIIMIIII II IMMM IMMM III 

ttcttgt atcccccaaccttaacccacaagtataagatacctctattccctccttgg 3 011 
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caaccgatcacacgcccattactatcccattaaaacctaatcacccttacccCgctcaat 

I 1 1 I I II I III MM III I M II 1 1 1 1 II II I I II M II II I 1 1 1 1 1 1 I 

tgaccaatcatgcaccccttaccatctcattaaaacctaatcactcttacccggctcaat 3 071 
gccagtatcccataccacaacaggctttaaagggattgaagcctgttatcacttgcctgc 

II I I MINI Mill II M I I M II Mill II I ! I 3 1 I 1 I I 1 1 1 I M I I I 

gccaagatcccatcccacagcatgctttaaaaggattaaaacctgttatcactcgcctgc 3131 
tacagcacgggcttctaaaacctataaactctccatacaattcccccattttacctgtct 

II MM II Ml MM MIMMMMMI 1 1 1 1 1 II I II M II II I II 1 1 1 II 

tagagcatggccttttaaagcctataaactctccttacaattcccccattttacctgtcc 3191 
aaaaaccagataagtcttacaggttagttcagaatctgcaccttatcaaccaaattgttt 

I II I I I I I II I I I II I 1 1 II I I II I I 1 1 1 II I I! I II 1 1 1 II 1 1 I I 

tagaaccagacaagccttacaggtt caggatctgtgtcttatcaatgaaattgtt t 3247 

tgcctatccaccctgtagcacccaactcgtacactcttttgtcctcaatgccttccccca 

I IIMIIIIIIMM I I III I II Mill I IIIIIMI III II I I 

tccctatccaccctgtggtgctgaacccatatactctcctatcctcaatacctccctcta 3 3 07 
caactcactattccgttcttgatcttaaagatgcttttttcactattcccctgcacccct 

MM II Mill Mill Mill Ml MINI: II Mill II I Mill I 

caacccattattctgttctagatctcaaacatgctttctttactatccctttacaccctt 3 3 67 
catcccagcctctctttgcttttacctggactgaccctgacacccatcagtcccagcagc 

II MINIMUM I III MIMIMMMIMIMMMMMIMMMIMI 

caacccagcctctcttcgttttcacctggactgaccctgacacccatcagtcccagcagc 342 7 
ttacctgggctgtactgccgcaaggcttcagggacagccctcattacttcagccaagctc 

IMMIIIIIIIM III MUM IMIMI lllllll MM IMMIIIIMM 

ttacctgggctgtaatgctgcaaggtttcaggggcagcccttattatttcagccaagctc 34 8 7 
tttctcatgatttactttctttccacctctctgcttctcaccttattcaatatattgatg 

MMIIMMMMIMMIIIIIMI Ml Mill I i M I I 1 1 I I ! 1 1 M 

tttctcatgatt tact ttctttccacccctccacttctcacct tat tcaatatattggtg 3 54 7 
accttctactttgtagcccctcctttaaatcttctcaacaagacaccctcctgctccttc 

I MM 1 1 U 1 1 I I 1 1 ! U I U I I IMIIIIIIIIIIMIIII II I f 1 1 1 1 1 1 1 t 

atgttcttctttgtagcccctcctttgaatcttctcaacaagacacacttctgctccttc 36 0 7 
aacatttgttctccaaaggatatcgggtatccccctccaaagctcaaatttcttctccat 

I Mill I I M I ! I I M 1 1 1 1 M MMIMIMMMIMI IMMIIMI 

agcatttattctccaaaggatatc cccctccaaagctcaaatgtcttctccat 36 6 0 

ctgttacatacctcggcataattcttcatgaaaacacatgtgctctccctgccaattgcg 

I Mill Mill IMIIIIIIIIIIII IIIIIMI MM llllllll II I I 

ccgttacctaccttggcataattcttcataaaaacacacgtgccctccctgctgatagtg 3 72 0 
tctccaactgatctctcaaatcccaacctcttctacaaaacaacaactcctttccctcct 

III IIIIIIIMIIIII lllllll ! M 1 1 1 1 j M 1 1 1 1 i 1 1 r 1 1 Mill MM 

tctg- - actgatctctcaaaccccaaccccttctacaaaacaacaactcttttccatcct 3 778 
aggcatggttggatacttttgcctttggatacctggttttgccatcctaacaaaatcatt 

I i I I I M I I II 1 1 ! 1 1 M I I M IMIIIIIMIIIIIIIIMIIIIIIIII MM 

aggcatggttggatactttcgtgttaggatacctggttttgccatcctaacaaaaccatt 3838 
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atataaactcacaaaaggaaacctagctgaccccatagattctaaatcctttccccactc 

MM I I I II Ml MM III IIIM , IMIIIIIMIII 1:111 IIINMMM 

atataaactcacaaaaggaaacctagttgaccccatagatcctaaatcgtttccccactc 3 8 98 
ctctttccattccttgaagacagctttagagactgctcccacactagctctccctgtctc 

1 1 1 M I I 1 1 ) 1 1 1 1 ! 1 1 f 1 1 1 1 1 1 1 i ! 1 1 J f 1 1 f I INI MMMMIMM IN 

ctctttccattccttgaagacagctttagagactgtctccactctagctctccctgactc 3 9 58 
atcccaacccttttcattacacacagccgaagtgcagggctgtgcagtcggaattcttac 

IMIII MMMM II! IIIM II II ! I I I I II 1 1 I I I I II I II I MMIIMM 

atcccaacacttttcattacacacagctgaagtgcagggctgtgcagtcagaattcttac 4 018 
acaaggaccgggaccatgccctgtagcctttttgtccaaacaacttgaccttactgtttt 

iiiMiiiiiiii i 1 1 1 i 1 1 1 f ! i r i i 1 1 1 [ 1 1 ; 1 1 1 1 1 1 1 m f 1 1 1 1 1 1 1 1 1 ; i 

acaaggaccgggatcgcatcctgtagcctttttgtccaaacaacttgaccttactgtttt 40 78 
aggctcgccatcatgtctccatgcggtagcttccgctgccctaatacttttagaggccct 

Mill IIIMIIIIIIIIIMM I II I II II Mill IIMIMM Mill 

aggctggccatcatgtctccatgcagcgtctgctgccaccctaatacttttagaggccct 413 8 
caaaatcacaaactatgctcaactcactctctacagctctcacaacttccaaaatctatt 

1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 ii 

caaaatcacaaactatgctcaactcattctctacagctctcataatttccaaaatctatt 4198 
ttctttctcacacctgacgcatatactttctgctccccggctccttcagctgtattcact 

Mill 1 1 1 ! 1 1! 1 1 f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I i II II II I II I 1 1 1 I 

ttcttcctcacacctgacacatatactttctgctccccggctccttcagatatactcact 42 58 
ctttgttgagtctcccacaattaccattcttcctggcccagacttcaatctggcctccca 

I II I llllllllllllllllll MMMM IMIIMMI IMIIIIII 

c--catttattctcccacaattaccattattcctggcctggacttcaatccggcctccca 4 316 
cattattctggataccacacctgaccctgatgattgtatgtctctgatctacctgacatt 

IMIII IMMMIMI IIMIMM MM II M IIMIMM IMIMI II 

cattattctggataccatacctgaccctcatgactgcatctctctgatccacctgacgtt 43 7 6 
caccccatttccccatatttccttcttttctgttcctcatgttgatcacatttggtttac 

1 1 1 1 1 II 1 1 1 1 1 1 1 1 IIMMIIII Mill MM IMMMI MMMM 

caccccatttccccacatttccttctgccctgtttctcaccctgatcacacttggtttat 44 36 
tgacggcagttccaccaggcctgatcgccactcaccagcaaaggcaggctatgctat 

Ml I I 1 1 1 1 1 1 1 1 M 1 1 11 1 i II 1 1 1 1 II i II II I II II I II II 1 1 MMMM 

tgatggcagttccaccaggcctaatcgccactcaccagcaaaggcaggatatgctat 44 93 
gaactgattgccttaactcgggccttcactcttgcaaagggactacacgtcaatatttat 

Mill IIMIMM II III MMMMIMM IMIMI MMMM III 

gaactagttgccttaattcaagccctcactcttgcaaaaggactacgtgtcaatatctat 4 55 3 
actgactctaaatatgccttccatatcttgcaccaccatgctgttatatgggctgaaaga 

Mill 1 1 ] 1 1 1 1 1 ! 1 1 1 1 1 Mill MMMMIMM II MMMMMIMM 

actgattctaaatatgcctttcatattctgcaccaccatgcggtcatatgggctgaaaga 4613 
ggtttcctcactacgcaagggtcctccatcattaatgcctctttaataaaaactcttctc 

I 1 1 1 1 1 I I i I i 1 ! I MM II 1 1 II I II M II II M II 1 1 II II I MM llll III 

ggtttcctcactacacaagtgtcctccatcattaatgcctctttaagaaaa-ctctgctc 4 672 

FIGURE 13.3 



WO 99/67395 




PCT/FR99/01513 



aaggctgctttacttccaaaggaagctggagtcacacactgcaagggccaccaaaaggcg 

I I I 1 1 I I I I I I I I I 1 1 1 1 II I 1 1 I I I I ! I II 1 1 IIIIIIIMII II llllll ! 

aaggctgctt tact tccaaaggaagctggggt cat tcactgcaaggggcatcaaaagact 4 7 32 
tcagatcccattactctaggaaatgcttatgctgataaggtagctaaagaagcacctagc 

I I I I I I I I I I I I lllllli I II I I I I I I I I I I I II 1 1 1 1 MM I Mill Mill 

tcagatcccattgctctaggcaatgcttatgctgataaggtggctagacaagcagctagc 4 7 92 
gttccaacttctgtccctcatggccagtttttctccttcccatcagtcattcccacctac 

MMMM I I I 1 1 M ; 1 1 1 M h I I M 1 1 I M I M MM MM IMMMIII 

tctccaacttttgtccctcatggccagtttttctccttcacatccgtcactcccacctac 4 8 52 
tcccccattgaaacttccgcctatcaatctcttctcacacaaggcaaatggttcttagac 

Ml I IMIIIIIII MMMM llllll I I Mill IIMIIIIMMIM 

tccacagctgaaacttccacctatcaagctcttcccccgcaaggtaaatggttcttagac 4 912 
caaggaaaatatctccttccagcctcacaggcccattctattctgtcatcatttcataac 

1 1 1 1 ii 1 1 1 ii M 1 1 1 ii 1 1 M i M ii ii ii i ii ii ii 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 

caaggaaaatatctccttccagcctcacaggcccattctattctgtcgtcatttcataac 4 972 
ctcttccatgtaggttacaagccactagtccacctcttagaacctctcatttcctt-cca 

II I i I 1 I i ( I I I 1 1 1 i 1 1 1 I 1 1 E I J 1 1 I lllllli MIMIMMIMM Ml 

cttttccatgtaggttacaagccactagcctgtctcttaggacctctcatttcctttcca 5 032 
tcgtggaaacatatcctcaaggaaatcacttctcagtgttccatctgctattctactacc 

II llllll II M I II 1 1 II I II I 1 1 1 1 1 I II I II 1 1 1 M II II II II II I I II I I 

tcatggaaatctatcctcaaggagatcacttctcagtgttccatctgctattctgctacc 5 0 92 
cctcagggattgttcaggccccctcccctccctacacatcaagctcggggatttgcccct 

M 1 1 I I I M I I I 1 M ! I M llllll I 1 1 I I I M I I IMMIIMIMMIIMM 

cctcagggattgttcaggcctcctccctttcctacacataaagctcggggatttgcccct 5152 
gcccaggactggcaaattgactttactcacatgccctgagtcaggaaactaaaatacctc 

II II 1 1 1 1 1 1 1 II 1 1 1 1 1 II M I II 1 1 II II II 1 1 I 1 1 1 1 1 IIIIIIIMII III 

gcccaggactggcaaattgactttactcacatgcctcgggtcagaaaactaaaatatctc 5 212 
ttggtctgggtagacactgtcactggatgggtagaggcctttcccacagggtctgagaag 

II lllllllllllllll llllll! Mill MIMIUIIIIM II IMIIMIM 

ttagtctgggtagacactttcactgggtgggtagaggcctttcccatagagtctgagaag 5 2 72 
gccactgcagtcatttcttcccttctgtcagacataattccttgggttggccttcccacc 

Mill II 1 1 I M i M 1 1 I i II i I M I M 1 1 ; I i I I I I i IIIIIIIMII I 

gccaccgcggtcatttcttcccttctgtcagacataattccttggtttggccttcccttc 53 32 
tctatacagtccaataacggagcagcctttattagtcaaatcacctgagcagtttttcag 

IIIIIIIMII MMMM I 1 1 I 1 1 1 i I MM MMMM MMMM MM 

tctatacagtctgataacggaccagcctttactagttaaatcacccaagcagtttctcag 5 3 92 
gctcttggtattcagtggaaccttcgtaccccttactgtcctcaatcttcaggaaaggta 

MMMMIII MMMMMMM II llllll II 1 1 1 II 1 1 1 II 1 1 II 1 1 1 1 1 1 

gctcttggtattcagtggaaccttcatatcccttaacatcctcaatcttcaggaaaggta 54 5 2 
gaatggactaatggtcttttaaaaacacaccccaccaaactcagcctccaacttaaaaag 

II llllllllllllllllll IMIMI llllll IMIMMMMMMIMM 

aaaccgactaatggtcttttaaagacacacctcaccaagctcagcctccaacttaaaaag 5 512 
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TGCCTTTATTTCCGTAGGCTGGTCATATGGCGCTAGCACTCACATAAAGCTACCGAGGAG 
AGCGAATGAAACCAAAATCACTTTACCTTCACAGCACGAGGCCGTCGTCCCTCTCGATAT 
TTGGCCCGTGTGTCGCATACCGCCCTCTGGACGTGGTGATCAAATAAACTCCCTAGCTCC 
CCGCCGCTCGACGCCATCTTGCCTACTTTGATCCTCGCAGGGAGGACAACATCCGCCCTA 
CTGAGCTCCCTTTTATCCAATAAGAGAGCGGGATGAGTTAAGGAGTGCCAGGATTGGCTG 
GAGAATCGACAGCGTCGGCCATCGTTTCCTGCGTGCGAAGATTTGATGAACGAGGTGCCG 
CCCCCGAGCGGCTCGGCGGAGAGGCGCGGTGGGTGACAGAAGCTTTCTTGTCCCACCCAC 
TACAGGCTTACGGCAGGATGCGCAGCGGGGAGAGGGGGCGGGGCCGCAGGGGGCGGGGCC 
GATCGATCTCCTCCGGCTCCGACGTCCTCGGCCTG CCGGGTCCCGGGTCCTTTGCGGCGC 
TAGGGTGGGCGAACCCAGAGCGACGCTCCGGGACGATGTGGGGCAGCGATCGCCTGGCGG 
GTGCTGGGGGAGGCGGGGCGGCAGTGACTGTGGCCTTCACCAACGCTCGCGACTGCTTCC 
TCCACCTGCCGCGGCGTCTCGTGGCCCAGCTGCATCTGCTGCAG GTAACCTGCCGGCCCC 
GAGCCACCTGATCTTCAGCCTGGGGTCGGACGAGGCCGAAGCCTCTCAGGGACGCGGCGG 
GACACCGGCTGCCACCCGGGCGCCGCCGAAGCGCGCAGAGATCAGGGTCCCTCGACGGCA 
GGGCCCTTCTGGGTAGTCTCTGGATCCCACAAGTCCAGTGCAGCCCTGGGCTCGTCTTAT 
CCCAGGTCTTTTCACTTGGTGAAACTGAACCTAGAAACGTCCTAATATTCTACCACTGTT 
TTTATAAATATTCCTTATTCCAGGCTGGAAAAGCTCCTGAGAAGTGGTTTGTTTTTATTA 
TTTTAAAAGGTGTTTTCCTTGCCAGCCATTTCCAGTTAACCTGCGCTGCTGCCGTCCGGG 
CCGCGAGAGCGGGACGCAGAGTTGTTGGCGGAGCCCCTGTCGGTTCCCGGGGACTAAGCA 
CCGCGTCCCATGAGCGGGAAAGGTTAATACAATGATGGTTCTGCCCTGCGTCGCTGACGC 
GGAACACAGCTGTAGTGTGTTAGGAACACATAACGTAGTTAAGATCACTTGAAGCTCTGC 
GATCAGTCGCCCTTCTGGACGTTGTGGTTAGGATGTTTCACAGTTCTAACCACTGGTGGA 
GATACAGCGTCCATATTTTCATAATTAAAAATAGAGGCACATGGTCTCACGAGTTTGAGT 
GTACTTATGGGGGCAAAAGGACGGCGTATTTGAAATCCTCATAAATCCTGGATGCATGGT 
ACCCACCAGTGGCTAATCTATGCAATGAATAGAGTTTGCAATAATTTCAAGCATCCCTTC 
TTTCCACTTGAGTTACTTCCCCATACCTAGGGGAAGATATTTTTGGTCCACTGAAAACAT 
GAGTTCAGCAGAATCCTCCTATCATCGTCGTTATTATTTTTTACCACTAAGTAGACAATC 
TTTTGGTTTTTGATGGGCTTTATGGCTAGAGACAAATCAGTCACTGTCACCAAGTTCCAG 
GTAGAAGTTGGTTCAGTGCTCTGTCAGCTTCGATGGGATTTTTCAACATGTTTTCAAATC 
TGCACTTAATAGTAGGAATGCTTTCTTACAGTAACTCTAATTTGATCCTAAGATGTAGTT 
GTTACCTTACATTCATCACTGTTTAAGAATTTAGTGGTCTTGATCTTTGTTTTAAATTTT 
GAGCCTTCGGGAAGTACTTATAAGAATTAATTCATGCATATCTTTTTGAAATGTAAATGT 
CTTTAGCCCTGGAACAAATTGCTGTTTCTGTTCAGCCCATATTAGCAGAATAGGTCAACT 
TTACTTT CTAATTATCAATGT AATAAGTTTATTACTTTAT AGATTC CATAAAT CTATACA 
TTTATTCCTCGATGAATTATATAAATTTATAGAATTTATGTTTTATAGAAAATTTGGAAA 
GCATGGAAAATTATTAACAAGAAAATAAGTTACCCATAATCCCAGAACTTAGAGGTGACT 
AATGTTGACAGTTTGGATCAAATCTTCCAGTTTTGTTTCTAATCTTTATTTTTAACATAA 
ATGAGGTCCTGTATACACACGTACAGTTTTGTGTCCTGGTGTTTTTATTTAATGTTATTA 
TGAGTGTTTTATTTTGTTAAAAGGTCATCATTTTAAGTTGTTAATTAGTATTCTAGCACA 
AATTTGCCATAATTTATTTAATTGTTTACTATGATTGACCATTTAGATTGTACTTAATTT 
TTAGGCATTAGAAGTGATAAACTATATTTTAATCAGACGTTGAAAATAACACATCTTTGT 
TTAGAAAACATCATTTTATTTCTGGTTGTCTAGGATAGATTCCCAGAATTCTTGGGTTAG 
AGGCCATAGATAATTATGAAAGCAGAAAGATTCACAAGTTGGGAGTTAATACTTGAATTA 
CTTTATTTGGGGTGAAGCATTGAGTGCATAATACAGATCATGCAGTAATGGGAAGAAGGG 
TTGGAACAATGGTTTTCTGGCCTATGTCAGACTTACCTTGAAGCTTTTAAGAATACAGAT 
GTTCTGATCAACCCTCAGACCTATTAAATCAGACCTAAAATCTTAGGGAATAGGCTTTAG 
GCATCTCTTLATTTTAAAAAATTTATTCAGGCTACTTGGATGCACAAAAGAGTTGAGACCT 
ACTGTCCTAGAATCATAGAATTTTAATGACGATAGAGACCTTAAGCATCTAGGTCGTTTC 
TGTACTTTTACATGTAAGGAAACTGGCATTCCTAGGCCAGTACCATTGCCATGCAGCTAA 
TTTGCCCTCTTGTCTATAGCTCACTCTGCATCACCCAACCTACCGTTCTCACTGTTTCTT 
CTATAACCAATCTCCTTCCCACTTCTGTTCTCTTACTCATGCCATTCTTCCCTCAGTCAT 
TTTTCTTCCTTCCATACAAATTCCATGTCTTTAAAAAGGAATAATCCTACCTCCTCCACA 
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TAGCTTTCCAATTCTCTGTTGCCCACATTTGTCTCCCTTTCAATACTTCTCTGTTGTGTT 
ATGTGACACATCACATTTGATATACTCTGTACTGTGTTTCAAGTATTGTATTCTCTTGTT 
TACTCAAGTCATTATTTCAGGACTGACTACCCAGTAGATGCTTTAAGTCAGGATTTCTCA 
ACCTTGGCACTGTTGACATTTTGAGCTGGATAATTTTTTGTTTTGGGGGCTCTCCTGTAC 
ATTTTAAGATGTTTAACAGCACCCTTGGCCTCTATCCAGTAGACGCCTGTACTGCCTCCC 
CCTATCTGTGACAACCAAAAAGGTCTTCAGACATTGTCAGATGTCTACTGAAGGACAAAA 
TCACCTCTGGTTGAGAACCACCGCTTCAACTAAGTTATCTTCTCTGTACTCAGAACTTGA 
TGTGATTGCAGCAGGGGGAGAGGATTCATATACACAGTGAATGCAAACGAACCTAAATCA 
CCATTCGGATATGGCCACACAATTTTCATTTCCCTTGTGTTAGCAAGAGATACCCTAGGC 
TTTGGACCTGATTATTCCTAAGGCATTCTGATGTATGGTTTTACCTGCAGATTTCCTGGT 
AATACTGATACCTCAGTTTGGGTCAAAGAAGGTCAATTAATTGATTGATTTGATTTGACT 
CCTGGAAAAGACGCTCCTTTCTAGCTGTCTCTTTCTTCTCTTTACCTGAATAGCCAGGGC 
TCTGTGGTTCAAGTGAAGTATTTTGACATAAAAATTAACTTAGAACATTGGTCTGCAGAG 
TTTGCTCAATATAACTGAGCACATATTGTGGCTTTATGGAGCTGGTTACTACTTTTTGAC 
CAAATAAATAATTAGAAGTATTTTTCCTCCTCAATAAGGTTCATTTTTCCTTTTTTCAGT 
GAGCTGGTAGAGTTTCCTTTTTTGATATTTCAGGGCATCTTTCATATTTCCATCTCTTAA 
GTTTCTTCATATGAAGTAGAATTTATCTGGATTATGTATTGCTGACTCTGATGAAAACCC 
ATAGAAAGCATCTGGGGCTTGATCACCTTCATTCTTGTAATAGCTCACACGGTTACAGCT 
GATATGGTAACTTAAGACTTTTGATTCCAAATCTAGGCAAAATACACTCAGTTGAAAGAA 
TTTGTCAGCCAGAACAGTTGGACTGTTCTGTGAAAATTGTGAGAAAAATTACACAACTAA 
GTGATACATGATGATGGCTTTCTTAAATATAAAATTGTAATAACATGGTTAATTTCCAGT 
ACGTTATATTGTCCCAGAAGTGGCTCCAACATTGTTTGAAATTTGTCTCATTTAAAGAAA 
CATAAGCTGGCTATGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCAGG 
CAGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGCCAACATGGTAAAACCCCATCTC 
TACTAAAAATACAAAAATTAGCCGGGCATTTGGTGGGGGCCTGTAATCCCAGCTACTTGG 
GAGGCTGAGGCAGGAGAATTGCTTGAATCTGGGAGGTGGAGGTTGCAGTGAGCCGAGATT 
GTGCCACTGCCCTCCAGCCTGGGTGACAGAGTGAGTCTCCGTCTCAAGAAAAAAAAAAAA 
AAAAGCAAGAAACATAAAGACTGGGCATGTTGGCTCATGCCTGTAATCCCAGCACTTTGA 
GAGACTGAGGTGGGAAGATCACTTGAGCCCAGGAGGTTAAGGCTGCAGTGAGCCGTGATT 
TTGCCACTGTACTCGAGCCTGGGCAACACAGTGAGATCCTGTCTCAGGAAAAAAAAAATT 
GCATGTAAATGAATGAATTTGATATTTAATATTTTAAATTATGAAAACTGTTCTGTAGAG 
ATGTAGATCTTGCCATGTTGCCCAGGCTGGCTTTGAACTTCTGGGCTCAAACAATCCTCC 
TGTCTCAGTCTCCCAAAGTATAAAGATTACACATGTGAGCCACTGCACCTGGCCTAATAT 
TTTTAACTTAATGAATTTATTTTGATATAAATAAATTAATAACACTGAAGCTTCCTGATA 
TAATAAGTCTTTTTGTGTGTGTGACGGGTTCTCACTCTGTTGCCCAGACTGGAGTGTAAT 
GGCACTATCATGGCTCACTGTAGCCTCAACCTCCCTGACTCAAGTGATCCTCCCACCTCG 
GCTTCCTGAGTAGATGGGACCACAGGCGTATGCCACCACACCTGGCTGATTTTTAAAATT 
TATTATTGATACATATTAATAAAATTATTTTTATTTTAAAAATGATATATGTGGCTGGGC 
ATGGTGGCTCATGCCTGTAATCCCGACAGTTTGGGAGGCCGAGGTGGGAGGATCACTTGA 
GACCAGGAGCTTAAGAC CAGCCTAAGCAACATAGTGAGATC CCATCTCTATAGAAAAAAA 
AAATGGCTAGGTGTGGTGGTGTATGCCTATATTCCCAGCTACTCAGGAGACTGAGGTGAG 
AGGATTGCTAGAGCCCAGGAGTTTCAAGTTACAGTGACCTATGATTGTGCCAGTGCACTC 
CAGCCTGGGCAACAGAGCAAAATCCTGTCTCAAAAAAAAAAAAAGTTCGAAAATGCTTAT 
GATGCAATATAAGTAGTGGAAAAGGATATTAAATTGTGCCTATATGAACACAACTATATG 
AAAAACTTGCACATAGAGAAAAGGATTAACAAGAAATAGACCAAATTGTTCACATGGTTG 
TCTTGTTTGTGGAGAGAATATCAGTAGTTCATTTGTTTCCTTCCAAGTTTATATGTTTTC 
CGAGGTCTCTATAATGAGTTTGTAATTGTTTAATCATAGAAAACCCTTTTTTGGTCCTTG 
GCCACAAACTTACATGTTTTAATGTAATTGCTTTTTTAATGAGAATAAATGTTATATTTT 
GCTTTTTTAAAACCTATATTCCCATAGTTATATGAGCCCTTACAATTATTAAGAGGCTGC 
ATAATATAACGTTTCTGGAAGGGTACAGAAGAAACAGCAGTAATTACCTCTGAGAACAGA 
GACATGGCTTCACATTTTACCCTTTTGTACGTTTTGTGCTTTTGCCACATGCATTTATTA 
TTCTTCCAATAAATAAGTAAATAAATATGGATTGTATACTCCATCTGGTTGGTGTTTCAT 
AATTCTAAAATTATATTGCTACATTTTTAAAGATGATATGTGTTTCTACTTATTAACGTA 
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TATGTTAAAATAGTAAATTTATATCTTATTTAATAATTTCCCTATTGATAGACATTTAAG 
ACAGTCTCAAGTGTTCACTATCATAGAAAATACTGCACAGATAGCTTTTGCTATAGTTTC 
TTTTTTCTTTGAATCGTTAATTGGGAATAAATGCTCAAATAGTTATATGTGGCTCAACTG 
CTATTTAAGTTTATTGACTGACTGCTGCCATTTTGAATTCTGAAGGGGTTGATTAAATTT 
ATAATGCTGCCATAAGAATATAAGGGTATTGGCTTCATTAGCATCCACCAGCATTGGGTG 
TTGGAAATGATTATAGATTTTTAAATGCTACAACAAATGTAGATAACAGAGAACTATCTA 
TAGAACTCTTTTTGGACATGTGAATTGTAATAATAGTTTATTTTCATGTGAATCCAGAAA 
AATGTATACGAAAACCTTTTTTCCTCTCATTTCTTATATGAATAG AATCAAGCTATAGAA 
GTGGTCTGGAGTCACCAGCCTGCATTCTTGAGCTGGGTGGAAGGCAGGCATTTTAGTGAT 
GGGGGACAGGTAAGCACATGTGATGGCAATAACTTTCTTCTAATATCACATAATATAGCA 
ATAGAAATAAAATTAAAAGTTTAGATTTTTTGTTAAAGGAGGTGAGATGTCACCTAATTT 
GTATGCTATTATGTAACTAGTCTAGGATATTGAAGCTGACTATACTCTGTTTTTAGGTCA 
TTATCTTGTAGTTTACCATACTCCCTACTTGCTTCTTATTCTACTATTTAACTCATTTTC 
CACATCCCCTAATTTTGGTTTCATGAAATTATTTTTCCTTCTGAATTACTAGGTTCTACT 
TACTATTATTAAACTTTATTTCTGACATATTTTATAACCTTCCATGGTCTCACTTGATTA 
AAAATAAAAAATTCAGCTGGGTGCGGTGGCTCACACCTATAATCCCAGCACTTTGGGAGG 
CCAAGGTGGGCGGATAATTTGAGGTCAGGAGTTGGAGACCAGCCTGCCCAACGTGGTGAA 
ACCCCCCCTCTCTACTAAAAATTCAAAAATTAGCTGGGCATGGTGGCAGGTGCCTGTAAT 
CCCAGCTACTCAGGAGGCTGAGGCAGGAGAATTGCTTGAACCTGGGAGGTGGAGGTTGCA 
GTGAGCTGAGATTGCACTGCTGCACTTCAGCTGGGTGACAAGAGCGAAACAATGTCTTGA 
AAAAAAATAAAAAATAAAAAATTCTACAACACAGGGTTATTATTTTTCCATTTTTGTTTT 
CCCTTATGAGTTTAATATGTTTAGATTATAAACCTGAAAGCTTGAATACCTATGTCTATC 
TTTTGTTTTCTTATGTTTATCAAGTTATTCCTTTAAACATTTTCTAAACTGTAAGAATAA 
TGTGAGGCTGGGCTCAATGGCTTATGCCTGTAATCCCAGTGCTTTGGGAGGCCAAGGTGG 
GAGGACCACTTGAGGCCACGAGTTCAAGATTAGCCTGGCTAGGCAACATAGCAAGACCCT 
ATCTCTATAAAAAAATTAAAAAAATTAG CTGGG CATGGTAGCAAATGC TTG TAGTC C C AG 
CTACTCAGCAGACTGAGGTAGGAGGAATGCTTGAGACCAGGAATTTGAGTGACCTATGAT 
TATGCACTC CAGCCCGGGC AATAGCAAGAC C CTATCTCTT AAAAGAAGAAGATGTAGT AA 
TAATACATATTCATTATAACTATTTTACCATTGAAAGTAAAAAATGAGTTTTTACCTTTT 
CCCAGTCCCATCCTCAGAATGGGGATCTCAGTAGACCTTTAGGATTGGAAGAATGAGATC 
ATTCATATTTTCTGCAATTATTACCCCACAAAATATTTCAGATACCTTTCCATGTATTAC 
AAACAATGTGCATTTAACATGTCTCTCTCTTTCTCTCTCTCTCTGTGTGCGTCTTCATGA 
TCCTCTGTTGCAGCCCTGCCAGTAAGACACTATCTCCTGAAGAATCACTGATAGGAACAG 
AAAGTGGACTGGCTAGGCCAGGAGTCCTTAGCTTCTTAGGGGGCAGGAGCTGCTTTGTGC 
TTTCTCAGAATCAGATATATATGTGGACTGAAACATTTAAAAACAGAATAGCCAAGGGTG 
CTATACGTTTAAAACTTATATAGATGGGGCTACATTGCTCTCTATTACTAATTTCCCATG 
ACAATACACGAGAGTGCCATGTCTTTTTAACTTGTTTTGAGCACAGACTAATCTTGTTTA 
TGCATGTTTTTTGATGAGAATAGGCTACTCATGAGAAATCTGTAAACCTAACACTAGTCC 
CTTGCATACTCTAAATTGTTGCTAGAATCTTAAAATTTTAGCACCAGACGGACCTTAGAA 
ATCATTAACTTTGGTGC TTTGTTCTACAATACAAGGAGATGGAATATTTTAC C CAGG ATT 
GCTTAGCAGGTTACAGTTCTGCCCTCTGAGTACCCAGCACTTCCCTGTGGGCAACATCAA 
CTTCCTGATTTTCAAGTCTTAATTAGTACTCTGAAGAATCCTACTTGTTTTTAACTCCCA 
TTTGCTTTGAAGTGACTTTACCTGATTTTTTTAGATCCCTTATTGCAGCAATGCCACTAA 
GAAACTGAGTCTCTAGCTTCTTGGTGGGCAGGAGCTGCTTTGTGCTTGCTCAGAATCATC 
CTTTTCAGTAAGGGAGATATTGAAGAGAAATCTACTGAGGAGTCTGGGGGTGAGGCACTC 
AGGGAAATCCTGCTCCAGTCCACAAAAGCAGAGAGGAAGGGTTGGTTACCTAGAGTATTT 
AACATGCAGAGGCTTTGGATTTTACTCCTTTAATCCTTGGAAATGCCTATGGAAGGGGAA 
AGGAAGTAAGATGGTGACTCCAGCTTATAGACATACTAGTGTTACATATATTTAAACTAT 
AATAGGAGGGTATTATTAGTTTTACTTAACTTTCAACTGTGAAGGATTATACTTCTCAAT 
ATTTGTCTCCAGTGTCTATTTCAGTGTATTTTTCACTTTTCTTGAAGCAGCATGTCTGTT 
GCAAAACTTCTAGAAATAATGAGAATATTTATATATTAGATCAAGCCATAACTTGATGAT 
ATAGTCATTTCTTCTTATATTTTTTACTTACATTTTTACATTTTAATGATTACTTTCATT 
TTTGAAAAACATGTCATGCTGAGATGTATTTTTCTTCATTCTGTAATTAGTTATGAAACA 
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GTTTTTCCTAAAATGCTGAGTATATCAAGTCTTGGCTAAGAATAAGTAATAAATATTTGC 
CACATGAAAGACTACACATATAGCCAGGTGCAGTGGCTTGCACCTGTTTTCCCAGCTACC 
CAGGAGGCTGAGGCAGGAGGATTGCTTGAGCCCAGGGTTTCCAGGCTGCAGTGAACTATG 
ATTGTACCACTCTACTCCAGAATGGGTGACAGAGCCAGGCCCCATCTCTCAAAACAGAAA 
AGAAAGATTACATAGACTACATATACACCCCCATCCAAAACATACACACACATCTACTTA 
ACCTAAAATGGTAAGAAGATAACTTCTTATTTTCTAATATATGACACAGAAAAGTTTTTT 
TAAAGTAGTTTTAAATTTTTAATTTTTTCTAG GTATTTCTCAAGCCATGTTCCCATGTGG 
TATCTTGTCAACAAGTTGAGGTGGAACCCCTCTCAGCAGATGATTGGGAGATACTG GTAA 
AGAAAAC CAAAT AAGAACTAT C TC ATTTAAGGTTAAATTACTT C ACAATAT CAATG T CTT 
TAGCTTTCTCTAAGCTTTATTATATATTCTGAGTTGGTTTTGAATTATAAGAATGAATTG 
GGGCCAGGCACAGTAGCTCATGCCTATAGTCCCAGCACTTTGGGAGGCCAAGGCAGGTGG 
ATTGCTTG AGTC C AGGAGTTCAAGAC CAGGCT GGGC AACATGGTG AAAC C C CGTAT CTAC 
TAAAAATACAAAAATTAGCCAGGCATGGTAGTGCATGCCATTAGTCCCAGTCACTTGGGA 
GGCTGAGGCAGGAGAATCGCTTGAGCCCGTAAAGTCAAGGCTGCAGTGAGTCAGGATCTT 
GCCATTGTACTCCAGTCTGGAAAACAGAGTGAGACCTTGTCTCAAATAAAAAAAGAATGA 
ATTGATAGAGATCTAATGTACAACCTGACAACTATAGGTAATAAAATTGTATTGGGGATT 
CATGTTAAATGAGTAGATTTTAACTACTCTTACCACAAAAACACAAAAGTGGGTAACTGT 
GAGATGATGTATATGTTAATTTACTT CACTATAGTAACCATTATAC TATCT ATATG TAG C 
TCATAACACCATGTCGTGTATATTAAATATGCACATTAAAATTTGTTTTTTAAAAAAAGA 
ATTGAGATTTTTTTTAACTAGATATGGAGTGGACAAAATGTAAAGTGAATTGATCTTTTC 
GTCTGTTGGTTCTAG GAGCTGCATGCTGTTTCCCTTGAACAACATCTTCTAGATCAAATT 
CGAATAGTTTTTCCAAAAGCCATTTTTCCTGTTTGGGTTGATCAACAAACGTACATATTT 
ATCCAAATTG GTAGGTGCTATTGTAATATTTGCTGTCATATTCTACACTATAGCATTGAG 
TCCAAAGTAGAAATGAATGTGCACTAATGAGCTTTATTTTCTACACAG TTGCACTAATAC 
CAGCTGCCTCTTATGGAAGGCTGGAAACTGACACCAAACTCCTTATTCAGCCAAAGACAC 
GCCGAGCCAAAGAGAATACATTTTCAAAAGCTGATGCTGAATATAAAAAACTTCATAGTT 
ATGGAAGAGACCAGAAAGGAATGATGAAAGAACTTCAAACCAAGCAACTTCAGTCAAATA 
CTGTGGGAATCACTGAATCTAATGAAAACGAGTCAGAGATTCCAGTTGACTCATCATCAG 
TAGCAAGTTTATGGACT ATGATAGGAAGC ATTTTTT C CTTTC AATC TGAGAAGAAACAAG 
AGACATCTTGGGGTTTAACTGAAATCAATGCATTCAAAAATATGCAGTCAAAGGTTGTTC 
CTCTAGACAATATTTTCAGAGTATGCAAATCTCAACCTCCTAGTATATATAACGCGTCAG 
CAACCTCTGTTTTTCATAAACACTGTGCCATTCATGTATTTCCATGGGACCAGGAATATT 
TTGATGTAGAGCCCAGCTTTACTGTGACATATGGAAAGCTAGTTAAGCTACTTTCTCCAA 
AGCAACAGCAAAGTAAAACAAAACAAAATGTGTTATCACCTGAAAAAGAGAAGCAGATGT 
CAGAGCC ACTAG ATCAAAAAAAAATTAGGTCAGATCATAATGAAG AAGATG AG AAG G C CT 
GTGTGCTACAAGTAGTCTGGAATGGACTTGAAGAATTGAAC AATG C CAT CAAAT AT AC C A 
AAAATGTAGAAGTTCTCCATCTTGGGAAA GTCTGGGTTAGTATAAATTTTATAACTTGGG 
AGAAATTTTATGTGGCTTAAACATCCCCAAATTATGAATTAGAATAGTATTTCATATATA 
AATTGAAAATCAATTAAAAAGAAACACAGTGCCTAAAGGCACTTGGGGGACACATTTACG 
CTTTGCAGTAAAGTCCTTGTTTGGATAAAGATTGTATGTTTTCTGGCCAAGTAAGCTTGA 
ATAGGTACAAGCTTAGATAGGTTCAGGCCAGAGAGGTCAAAATTACTTGCCTGAGATTGC 
ATAGCTAGTGTTACAACTAGGATTCAAACCCAGGCAGATTGACTTGGGGGTTCATCAGGA 
TGGAGTGCCCTACAAAGCCTCCCATCTTTAATGCTTGCAGATTTGTTCCCCAGTTACCGA 
AAGCAACTTGTTAATATTAGGGAAAAGGGCCAGTGTAGGGAGAGATCCATGGCATGAGGT 
AACCTTCCTGCTGCATGTGGTGGCACCTGGATTGGAATGCATCCAGGAGCTGCTTACCCT 
GCCGGTGTCTGCTCTTTAATTTGTGTATAACGGAGAGGAAGTAGACAGGGCAACTAGTGC 
TCCAGCCCCTCATCCTGGCCACAAATATTAATGCTACCTTTATATGACATAAGTCACTAG 
TCCATTTATTGGAACCTAAATTTGAACCACTGTAAAGTAAGACTTCATAGTGATAAAGAG 
AGGAACTTGTTAGGAAAGAGAATAAAATAGAAAGAGAAGGTTGTCTCCTTTTGTAGATTT 
TTTTTTTTTCTCCAACAGTTTTACCTGTGACCTTTATACAAATAACTGACAAAGCATTAA 
TCTCTTTGGCCTACATCATTTTCTTTTCTATTTTTTTTTTCCACAAGATGGAGTTTCACT 
CTTCTTGCCCAAGCTGGAGTGCAGTGGCATGATCTGGCTCACTGCAACCTCCGCCTCCCA 
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CGTTCAAGTGGTTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGGCATGCACCAC 
CACGCCTGGCTAATTTTTTGTATTTTTAGTAGAAACTGGGTTTCACCATGTTAGCCAGCC 
TGGTCTGGAACTCCTGACCTCAGGTGATCTGCCTGCCTCGGCCTCCCAAAGTGCTGGGAT 
TACAGGCATGAGCCACTGCTCCTGGCCGGCCTACATCATTTTCTAAAGCTCCAGAC CATT 
CTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTCTTTTTTCTC 
TTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTCTCTTTTCTTTTCTTTTTTTGAG 
TTAGAAGCTTGCTTTGTTGCCCAGGCTGGAGTGCAGTGGCACCACCTCCACTCACTACAA 
CCTCCACCTCCCAGGTTCAAATGATTCTCCTGCCTCAGCCTTCAGAGTAGCTGGGACTAC 
AAGTGTGCGCCACCACTCCTGGCTAATTTTTGTATTTTTAGTAGGGACGAGGTTTCACCA 
TGTTGGCCAGGCTAGTCTTGAACTCCTGGTCTCAAGTGATCCGCCTGCCTCAGTCTCCCA 
AGGTGCTGGGATTACAGGCGTGAGCCACTGTGCCTGGCCTCAGATCATTATTTTCTGTTA 
GCTTTAAACTGTCCGTTCAGGAGATCCCACTGCATCCTCAAATTCAAAATATCTAACACT 
GAGCTTATGATTTAGCTGGTTCTGTCATTAGATGGGAATATCCTTTTATTTCCTTGAAAT 
TATATGGTGAGAACAGGGAGAAGTGCTGATGGTAAAGTCCTGTGATTAAGATAGCAATAA 
GGACTCCGCCCTTCCCACTCCACTGAAGGTTGAAGAGCCATGGACAATGAGAAGTCACAG 
TAGGTGAAATCAGGTACTAAAATGGACTTGGCTTGAGAGATCAAAATTGATCACTTGGTG 
ATACAACTAACAAATTCATGTTAACTTGAACCTTTATTACCCTGTGAAGCATGGTGATTA 
AAAAAAAACAACAAACAAACAGGAAACTTGATTGTTAAATTCTCTTTAAGTCAGAATATG 
TACCTTAGAGTTTTTATTTATGCTTTTGTCTACCATTAATATGTCTGCACCTGCTCTTTA 
GAAGTTAATAGAGAGTAAAGTCGTCTTTATGTCTTTCAGTGCTTACTTATATTTGGGAAG 
TTGAGAAAAATTTTTAACATCATTATTGATATATATATATATATATATATATATATATAT 
ATATATATATAT AT ATATATATAGAT AATTTTTTTTTTTTT CTTGAGACGG AGTCT C ACT 
CTGTCGCCCAGGCCGGAGTGTGGTGGCGATCTCCACTCAATGCAAGCTCTGCCTCCCAGG 
TTCAAGCGATTCTCTTGCCTCAGCCTCCCGAGTAGCTAGGATACAGGCTCCCACCACCAC 
GCCTGGCTAATTTTTGTAGTTTTAGTAGAGACGAGGTTTCACCATATTGGCCACGCTGGT 
CTCAAACTCCTGACCTTGTGATCCGCCCACCTCGGCCTCCCAAAGTGCTGGGATTACAGG 
CGTGAGCCACTGCGCCCGGCTGAGGTAAAATTTAAAGTGTACAATTCAGTCATTTTTAGT 
ATATTTATACTAGTTGTACAGCCATCACCACAATCTAAGTTTAGAACATTTTCATTAGGG 
GGTGGGAGAAATTTTACTCTGCTTTTTAGATTAAGTTTCTGTCTGGATCTAATCATTTAA 
TCAGACAATCAGGCAGATTGTCTGTGATTAGTTTTGGCCATTCCAGCTTCTTCATTGGTT 
GTTAACTTTCACAAATAAAGGCTGCTCAAAGATTAGAAATAACATTTAATTTGAATGTAA 
ATGTGC C ATAGTTTAAAAGATGGGTTTGGTG AATAC AGTCAAATAC ATACATTTAAAG C T 
CTAATTCTGAAGATTATGTAAAGAAAAGGAAAGAAATGTAGGGAGAGGATTGAAATGTTC 
ATGGTATAACAATATCTGAACATCCATCTGGTCACACCGTTGGTATTTGAATGTTTTGTC 
CTCCTCAAATTCATATGTCGAAATCCCAACTCCCAAGGTGATCGTATTAGGAGGTGTGGT 
CTTTGGGAAGTGATTAGGTCATGAAGGTGAAGCCTTCATGAATGGGATTCGTGCTCTTAT 
AAAAGAGAACTGTGAGAAATAAGTTTCTGTCGTTTGTTAGCCACCCAGTTTAGGATATTT 
TGATATAGCAGCCTGCATGGACTGAGACAACTATGAGTTATTATGATAGCTTCTGTTATT 
TCACCTAAATTCATAGAAGCTAATATATCAATATTTATGCTATGAAATATTTCTTAACCA 
AGCTTTGAATATATTTATATTTTTGTTTATTTTTAAATTTCAG ATTCCAGATGACCTGAG 
GAAGAGACTAAATAT AGAAATGCATGCCGTAGTC AGGATAACTC CAGTGGAAGTTAC C C C 
TAAAATTCCAAGATCTCTAAAGTTACAACCTAGAGAGAATTTA GTGAGTTCAAATATATA 
TGTTACATCAAAATTCTTTTACACGTTTTGTAAGATTTCTAGTTGCTTTAGCTAAGTAAT 
AAGAATGTTGTATTCCTTTTTGATACAAATCTTTTTTTATTGTGTTAAACTATATATAAC 
ATAAAATATGCCATGTTCGCCATTTTTAAGTGTATAATTCAAAGGCATTAATTACATTCA 
TAATATTGTACAACCATCACCACTATCTATATCCAGAACTTTTCCATCACCCCAAAGAGA 
AACTTGGTACCCATTAAACAATAATTCCCCGTCCACTCCTTTCCCCAGTCCCTGGTAATC 
TCTAATGTATATTGTGTCTCTATGAATTTACTTATTCTAGATATTTCATATATAAGTAGA 
AGTATGCATTTGTCTTATGTATCTGACTTATTTCATTTAACATAATGTTTTCAAGGCTCA 
TCTGTGTTGTATGTATCAGAATGTTATTCCTTTTCATGGCTGAATACTATTCCATTGACT 
GCATATACCACATTTGTTTATCCATTCATCTGTTGATGGACACTTGGGTTGTTTCCACAT 
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TTTTGGCTGCTGTGAATAATGCTACAGTGAACATTGGTGTACAAGTATCTGTTTGAGTTC 
CTCTTTTCAGCTCCTTTGGGATATACCTAGGAATTATGTTTAACTTTTTGAGAAGCTGAG 
AAATCTTTAATAAATGATAACACAAATACTTATATTTGCCAATGCAAATATGAATATTTT 
TGGCTTTTAAGAGATTGATCATTTTGCCACGTGGTTGTAATTAAAAAAAATTGTCCCATG 
TTGTTTCAGTATTAATATTGTAGCCTAAAAGAGTGCTAGACTGTTTTACTTTTTACTCAG 
TTAATTCTTTGGATACTGGTAGAGTCAGGAAATGAGATATTGAACTTAAAGATCTTTGCA 
GGTGGGGTCCAGTGGCTCACACCTGTAATCCTAGCACTTTGGGAAGCTGAGGTGGGAGGA 
TTGCTTGAGGCCAAGAGTTTGAGAATAGCCTGGGCAACATAGCAAGACCCCATCTCTACA 
AAAAAATTAAAAAAAAAATTAAGCCAGGCGTGGTAGCTCACGCCTGTTATCCCAACACTT 
'CGGGAGGCTGAGATGGGTGGATCACTTGAGGTCAGGAGTTGGAGACCAGCCTGGCCAACA 
TGGTGAAACCCCATCTCTACTAAAAATACCAAAATTATCGGGGCGTGGTGCTAATCCTGT 
AATCTCAGCTACTCAGGAGGCTGAGGCAGGAGAACCACTTGAACTGAGGAGGTGGAAGTT 
GCAGTGAGCCTAGATCTCACCACTGCACTCCAGCCTGGGTAACAGAGCGAGACTCTATTT 
CAAAAAAAGTAAAAATAAAAATTAGACACATGTGGTGGCACATGCCTGTAGTCCTAGCTA 
CTCAGGAGGCTGACTGAAGTGGGAGGATCTCTTGAGCCCAGGAGTTCCACACTGCAGTGA 
GCTATGATTGTGCCACTGCACTCCAGCCTAGGCAATATCTCAAAAAAAATTTTTTTAAAT 
AGATTATTAGGCCAGACGTGGTGGCTCATGCCAGTAATCCCAGCACTTTGGAAGGCCAAG 
GCAGGCGGATCACCTGAGGCCAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCC 
ATGTCTACCAAAAATACAAAAATTAGCTGCAATGTCTATAATCCCAGCTACTTGGGAGCC 
TGAGGCAAGCGAATCGCTTGAACCCGGGAGGCAGAGGTTGCAGTGAGTGGAGACTGCGCC 
ACTGCACTCCAGCCTGGGCGATACAGCGAGATTCTGTCTCAAAGAAAAAGGAATTTGTTT 
TCCTGTCTTTATCGTAGAGGGAGGAAAGGGAGAATGGGGTTGGAATGGTTATTGAGTGAG 
CCACATTATGGTAGATGTATCACTGGGCATAGAGAAAAGGAGCATTTAAAACTTTTCCGC 
CTAACAGATGTTTCTTCAGGCTACACTGCACTCATTGTGCTAACTGTAATGTCAAATCCC 
AGACCTGTGCCTATAGAACATGAACATCCTTCATTGGATTTGTTTGGTCAGGCTTACACT 
TTATTAGGAAGATCAGATGTTAAAATAAGGGTGTTAAAGTTAAGTTCAGATATGAGGATA 
ATTCATTACTATTCCTTTTTCTGGCAG CCTAAAGACATAAGTGAAGAAGACATAAAAACT 
GTATTTTATTCATGGCTACAGCAGTCTACTACCACCATGCTTCCTTTGGTAATATCAGAG 
GAAGAATTTATTAAGCTGGAAACTAAAGATG GTGAGTACATTTGTTATTTTGACTTTTTT 
TTCTATTTAAATAGTTGTACATTTTTAATTGTTCTTGCAACCTGTCATACCTGTGAACAG 
TATGTGAATAGTGAAATATAATTATGATAATTAAACAGTAGTTTTTATGTATTGAAAAAT 
ATCTTTGGCCGGGTGCAGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCA 
GGCGGATCACTTGAGGCCAGGAGTTCGAGAGCAGCCTGCCAACATGGCGCAACCCTATCT 
ATACAAAAAAATACAAAAATTAGCCTGACATAGTGGTGTATGCCTGTAGTCCCAGCTACT 
TGGGAGGCTGAGGCAGAAGGATCACTTGAGCCCAGGAGGTCTGTGTTCCTGCCACTGCAC 
TCCAGCCTGGGCAGCAGAGTGAGACCCTGTTGGGGGGAAAAAAAAAAAAGTCTTTAACTT 
AAATAAATTTGACATTTAAAATCTTAAATTATTTCATCTCTGTTTCAGTACTAACTCTGC 
ATTTATTACTTTCTTTTTAATA GGACTGAAGGAATTTTCTCTGAGTATAGTTCATTCTTG 
GGAAAAAGAAAAAGATAAAAATATTTTTCTGTTGAGTCCCAATTTGCTGCAGAAGACTAC 
AATACAA GTAATAGCATGTTATTGAATATTTAATAAAATACTATTTGTTACATATGATTG 
ATAATAAAGTATGAAGTTCCTTGTAACACCTTGCATTGTGAAGTGTATTAAAAACCTGCT 
AAGAGTAAGGAATAACTTGATTTAAAATATTTTATTCTGTAATCTCTTTAAATTATCTGT 
ACAAATTATTGACTTAACCTAAATTTAAAAATGAATGCCTTAGCACAATTAAGTTCCAAG 
AATAGAGTTGATCATGTTAACTGGTAAATGGATCATGATTTAAAATTCTTCTAGGATTGA 
AACAAATGAAAACGTAGTTTTAAGGGTTTGATTTTTTAAATTCCTATTTTTACATGCAAT 
TTTACTGCACAACCCATCTTATTTTGACAGTTCTTAAATTCGCAACTCTTCAGAAATATT 
ATCAGATCACTTTTCTTTGCTTCCATAAGTTTTTTTATTATTATATTATTATTTTTTTTT 
TTTAAAAGACGGTGTCTCACTTTGTCGCCCAGGCTGGAGTGCAGTGGCATGATCATGGCT 
CACTGCAGCCTCGACCTCCCAGGCTCAGGTGATTCTCCCACCTCAGCCTCCCAAGTAGCT 
GGGACCACAGGCGAATGCCATGATGCCTGGCTAATTTTTGTATGTTTTGTAGAGATAGGG 
TTTCACCATGTTGCCCAGAATTGTCTTGAACTCCTGGGTTCAAGCAGTTGTTCTGCCTTG 
CCCACCCAAAGTTGTGGGATTACAAGTGTGAGCCACTGCGCCCAGCTATTCTAGAAGTAT 
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TTTAAGAGTCATCTTTTTTTTTTTTTTGAGATGGAGTCTCACTCTGTCACCCAGGCTGGA 
GTGCAGTGGCACACTCTCGGCTCACTGCAACCTCCACCTCCTGGGTTCAAGTGATTCTCC 
TGCCTCAGCTTCCCTAGTAGCTAGGATTACAGGCGCATGCCACCATGCCCTGCTATTTTT 
TGTAGTTTTAGTAGAGACGAGATTTCACCATGTTGGCCAGGCTGCTCTTGAACTCCTGAC 
CTCAAGTGATCTGCCCTCCTCAGCCTCCCAAAGTGCTGGGATTCTAAGTGTAAACCACCA 
CACCCAGCCAAGAGTGGTCTTTTTACAATATTATTTTTTGATTAGGACATTCATTCTTGT 
CATAAAATTGAAGATACTCTAGTCATTTAGAATTTCATTGTTTTGGAACTAGACATTGTT 
TCTTTATTTTTGAAATGTTATTGAAGGAATACCATTTGGAGAAGATACAAATGTAAGAAT 
TGTGAAAAGGATAATTGTG AC ACAAAT CAAAATTAT AGATAAAAAT ATAC CTGTAAAATG 
TATTAAGGCAATAACATTCTTTCTGCTTGTTGACCATAAATATTTATATTCCCTGGATGG 
GTACATTGTTATTGTCAAGGGTGTTTAAATAATGATCTTGCATGCATAATTTATTCTCTC 
TGGTATAACAGAATCAGCAATTTAGTTTTCTGGGACCCGAGAAAAACATGCAAAAGACAT 
ACTTTGAAATGTAAAACTGATTTTTCCTTGCAACTGTAG GTCCTTCTAGATCCTATGGTA 
AAAGAAGAAAACAGTGAGGAAATTGACTTTATTCTTCCTTTTTTAAAGCTGAGCTCTTTG 
GGGTAAGAAGTTATGGCCAAACTAGCATGTTAGACATGTTTTTAACACTATATCTGGCAG 
AGTTTTCAATGTAAATATTAAAGTAGATGTTAATGTCAATAAGTGATCTTAATAATGCAT 
CAGTAGATATTTTTTCAAGGATTGTCTCTATCTTCACGCCTAGCTTATAATTTGCCTTGT 
CGTCTTTTTTTTTTTCTCTTTATTTTTATGTTTTTATCCATCCCTGGTGGTAGGGGATAA 
CCTTGTCTTCTTCGATAACAAGAAGTCTGAAGCTTATTAGAAATTTTACTTTGAGAATTG 
ATCGATGAGAAGAAAGC AACTAGATATCACGTGGAT CATATATG CTTGAAT AAAACAATA 
ATTCTTAGAACAAATAAATACATTTTAAAAGTTAAAGCCAAAAACATTAGTTGAATGTTT 
AAAAATATTTCAAATTAAGTTATTCCTTCACTGTCTTGTATTACTGTAATAATTTGGATT 
ATTTGTGTTTTTCTCAACTTTTAAAACAAATATTTAAAAAATTCCTCTTTTGATTAAGTA 
GGGCTAGATAAAATATAAAAAATATTTTTTAAACTCCTCTTAATTTCCATATTTCTTATA 
TAATATGAGAATCTCTTATAAACACTACCTCTTAGAAGTCTCCACAGAAGCTTTGGTAGA 
TGTAGTAGTAGGGATTTGATTTCTTAGAATGGTATAATCTGTAAATGTTTTAGTAAAAGG 
ATTAAACGATAAAGTCAAAATGTTTATAGCACAGTGTTTAT TAATATAAAATAAAATCT C 

TCTCAGCTCATTGCAACCTCCGCCTCCTGGGTTCAAGCAATCCTTCCGCATCAGCCTCCT 
AAGTAGCTGGGATTACAAGCATGCACCACCACACCTGCCTAATTTTTTGTATTTTTAGTA 
GAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAGTGATCCGCCTGCCTCAGCCTC 
CCAAAGTGCTGGGATTACAGGCGTGAACCACTGTGCCCAGCATAAAGTAAAATCTCTTCA 
GACTCTCATGTGATCATGTAAAGTGGCAGGCAGTCACAGTCAAGAAGTAGTTTAAAGTTC 
ATGTTTGTAAAATATAATCTACAGATTGATACTGGATTTCATAGGTAATGTTTAAGAGAA 
AATAAGTTTTTAGTTATCCTCAGTACTTCAAAAGCACCCATTTATGATTATGTTGATTAC 
TAAACTAAATCATTTGGGGGCTAGAGGTGTTTTTTTATGTGTTAAGATTCCTTAAGGAGT 
TCTATTAGGGCAAAACTTTTAGTAACTGCATATTTTAAAAGTAATAAAACTAATTTTAAA 
AGCTTGGAGGCTGGGCGCGGTGGCTCACACCTGTAATTCCAGCACTTTGGGAGGCCAAGG 
CGGGTGGATCACTTGAGGTCAGGAGTTTGAGACGAGCCTGAGCAACATGGTGAAACCTTG 
TCTCTACTAAAAATACAGAAATTAGCCAGGTGTGGTGGTGGGCACCTGTAATCCCAGCTA 
CTCGGGAGGCTAAGGCAGGAGAATTGCTCGAACTTGGGAGGCAGAGGTTGCAGTGAGCCG 
AGATCATGCCACTGCACTCCAGCCTGGGTGACAGAGCAAGACTCCGTCTCAAAAAAAAAA 
AAAAAAAAAAGCTTGAAGTCAGATTCGACATTAATCAGTATACTTTCTCTCAAGTAGGGG 
ACAATTTCTAAGATTTTAGTCTTTTAAAATTTATTAACTAGTCTGAGCATGGTGGCTTGT 
GTCTATAATCCCAGCACTTTGTGGGGCCGAGGCAGATGGATCACTTGAGCCCAGGAGTTG 
GAGACTAGCCTGGGCAACATGGCAAAACCCCGTCTCTACAACAAATGCACACACAAAAAA 
CCCAATCAGCTGGGTGTGGTGTTACACTCCTGAAGTCCCAGCTACTCGGGAGGCTGAGGC 
AGGAGGATCACCTTTGCCAGGGCGTTTGAGGCTGCAGGGAGCTGGGTTCACACCACTGCG 
CTCCAGCCTGGATGACAGAGCAAGCCCCTTTCTCAAAAAAAAAAAGATAAAAAATTAAAT 
TAAATTAATTAACTACACTGGGAAGGCAAAATTCAGCATTTTTTTATAGCTAAATTTTAT 
CCTGCTTCAGTCTTTTATCATGTAACTATGTATATTTTTTACAG AGGAGTGAATTCCTTA 
GGCGTATCCTCCTTGGAGCACATCACTCACAGCCTCCTGGGACGCCCTTTGTCTCGGCAG 
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CTGATGTCTCTTGTTGCAGGACTTAGGAATGGAGCTCTTTTACTCACAGGAGGAAAGGTA 
AGTGGTTAAGGTGTGTTCATTTTTCTGTAACATTTAATAACTTTTCATTTATCTTTCTTT 
GGGTTTTGACCATCTATTATATAGGGTGGGTTTTGACCATCTATTATATAGGGTTTATAC 
GACATATGGAAAGCATTCATTTATTCACTAATATTTCTGTGTGTCTGCTTTTAGGTGTTG 
GGGGAGTGATGACGAATAAGACTGATGTTCTCCATGCCCTTTTTCTGTGTCAGTTGATAC 
AATTATATGGTTTTTCTTTTTTAGGCTATTAGGTGTTGATAGGGTTGAGTAACTTACAAA 
TGTTGAACCAGCCTTGCATACCTGTGATAAATACCACGTAGTTGTGGTGTATCATTCTTT 
CTACATTGCTGAGTTTTATCTGCTAATGTTCTGTTGAGCTTTTGTCCATTTAAGTTTGAA 
AGTGATTAGTTTGCAGTTTTCTGTTTTTGTGTTGTCTTTGTCTGGTTTTGCTATCCGTGT 
AAATCTGGCCTCATAAAATGAGATGGGAAGTATTCTCTCCTCTTCTTTTGTTTTTTTGGA 
AGAGGTTGTATAAAATTGAGGCTGAATCTTGGTGGTTGCCACAATGACAGGAACTATTTC 
TGTGACTGAATATATTGGGAATTCCTATAAAGCAATTATTTTCTAG GGAAGTGGAAAATC 
AACTTTAGCCAAAGCAATCTGTAAAGAAGCATTTGACAAACTGGATGCCCATGTGGAGAG 
AGTTGACTGTAAAGCTTTACGAG GTATGAGTATGGTAACACTCTATATAAATCCCTTTTT 
CATTAGAAAGAC AGGAATGTTATACATAATG CTGTCAAT CTAATAAATACACATAT CATC 
TAGTCTTTAACTTTTCTGTTTATCATTTAGTCATTAAAATTTCTTTGGCTTTCTAATGTT 
TTTGATAAAATTTCTAAAACTCTCCATATTTAATGGAGGCCTATTTTTTTTTCTAGCCAG 
AACTTTTTGTAGACTACATTTCTGGAAGTGCTCACTGACACCACTCTGAAAAATTAGTAC 
TTAGAATATACTCTAATTGGTATAAATGATCTCTGAATTGCTATGGAAAACTGGGAGAAT 
GGTTGCTTCAGGGGAGAGAAAGTAGGAGGCTGTGGACAGCAATGAGGAGAATTACAGTTC 
ACCATATAACACTTTTGTACTTTTAAAGTCCTTAACATTTACATTATTATCTATTCAATT 
AAAAAATATTGGGAAGATTTTACTTTGAAC AGTTAATTTTT CC C C CATGGGTAC CGCTGT 
CATATAGTTCCAACTAATCATGAACTTGTGTATTTCCTGTTCTTTGTAAATTTAAACTTT 
GTAACTCACCAGGAAGTTTGAAGCCAAATTTGTGTTTCAAATATAGCAACTCCAGGATCT 
CTAGGCAGATGCATTTGCATTTGATTTTAAATGAATCTTGATCCCTTACTCTCACTTATG 
TTTTCCCACATCCTACTTTTTTTATTTTGTTGTAAGCCATCTAAAATTCTCAATGGGATG 
AAACTGGGTATAAATGAATACATGCATACAGGAATTATAGTAGCATATTCCTTTTCTTTT 
TTCTTTTTTTTTTTTTTTGAGACAGAGTCTTGCTCTGTAGCCCAGGCTGGAGTGCAGTGG 
TGCGATCTCGGCTCACTATAGCCTCCACCTCCCAGGTTCAAGCAATTCTCGTGCCTCAAC 
CTCCCGAGTAATTGGGACTACAGGTGCATGCCACCACACCTGGCTAATTTTTGTATTTTT 
TAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGATCTCAAACTCCTGACCTCAAAGT 
GATCTGCCTGCCTTGGTTTCCCAAAGTGCTGGGATTACTAGCATAAGCCACTGCACCTGG 
CCTCCTTTTCTGAGTTTTATAAAATTTGATACTTTACTGCACGCTTTGAGACTGTATTAA 
TTGAACCATGTTGATGAACAAGTTTTTGTGATGGGTATATTAATAAAATATAGATCAAAT 
TTTTATAGTTAAATCAATATCGAGCTTTTCTAGTGCTTTCAAAAGGACAACCTGAATTTT 
CCCAGCACTGAAATGATACTGAAACCATTTCATATCTTCTGTATTAAG GAAAAAGGCTTG 
AAAACATACAAAAAACCCTAGAGGTGGCTTTCTCAGAGGCAGTGTGGATGCAGCCATCTG 
TTGTCCTGCTGGATGACCTTGACCTCATTGCTGGACTGCCTGCTGTCCCGGAACATGAGC 
ACAGTC CTGATGCGGTGCAGAGCCAGCGGCTTGCT CATG GTAAATGCATC C AC CACTGGC 
TTAAGGTCTTGTTCTTTTGTCAGTCAGCATTTTTAGTCTTAACAATAAATCTACTCTCTT 
CAGAGAATAATATATGTGTTATGTTAAGTGTTGTGTTTGAGGCCCCTGATGGCATTCTAC 
AGTTGTC CTATAG ACTGTAATAGCAAAATTGGTAGAGTAAAAAC AGTGTGAAAATT CTG C 
AACTTCATGGTTAGTCCTTTAGGGTTTTTCATTCTCCCTTACTTATTGTTTAATTTACAG 
ATTTACTCTTTTGTTCATTTGACAAATATTTGTCAAATGCTTGTGCACAGTCTGTATTCT 
CAAATTCTAGGAGAAAAAGAAGGGTGAACAGTATTAGCGCAGAACGATACTAATAATGAT 
GGCTACTGTGTATGAGTAGCCAGCCCTTTCTTGGCTTTCTTGGATTGCTTTGTATTCTAC 
ATGAAGATATTCCCTGGGCTTTACAGGTCAATAAATGGAAATTCAGAGAGATTAATTTGA 
CCAGGGTGACCAACAAGGAGATGACAGCATACACTATGCGAGAAGTATACACAGAGTAGT 
GTAGGAGCATATAACCTAAACTGGGGGTGAGGTGGGATAAGGAGTTATCAGGGAAGGCTT 
TTTGGAGGAGTTGACAACTGAGCCGAGTTTTGATGGAAGAGTAGAAATTAGCATGAACCA 
ATTTCATGCTAATAAAGAAGCAAAGGAAGCGTGGTCTACAGGCAAAAGCACAGAGGTACA 
GGAAGTAATGATATGTTGGGGAATACCCTGTTGACTGGAGCTTAGAGTGCAAGGAGAGGA 
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GTGCTAGGGAGGTGAGGTTGGAGGGTTTGGCAGCATTGACTTGCTTCAAGGTTCTTAAGA 

GCTGAAATAGATATAAAATGCAACTAAGAGTGGCTTGGATTATTATTACCTAGTGTGTTA 

ATCTCAAATTTTGAAATCTATAGCATCTATAGGACTGGTGTTACTAATCTTACACTCGAT 

CTGTTACTGTTCTTATACTAGATCTATTAGTCCAGTGTTTAAGGGAGTGGTGCAGATTTC 

TAGGTCAGGACAGGACTCAGATGTACATTATTAATGCCTATTTCAGTTCTGACCTTCTCA 

TATGAAACCTTATAAGACCTGGGGTAGGAAGAGATTGTTCTGGAAGTCATAGGAATATGA 

ACTGTATTTTGTTTAACAAACAATACAGTATGGAAATTTATCACCCTTCCAGAATATTTA 

TTTCAGAGACAAATTTTTATCATTCGTTCATTTATTTCATAAGATCCACGAGTAGGGAAC 

CTCACTAGACATTGCTCTGAGTATATGGTCTGAGTTTGCAGTACCTCTTGTGTCTCCATT 

AGATTTATTAGGTCCTCAATAGATAAATCAGGGAATAACTAGATGGATTCATTTTTTAAA 

GACATGAAAGAGCGATACCATACATACTGCACCTTAAAGGTCAACCTTAGAGTATCATTA 

TTTTTAATGAATGTATAATTTTTAAATTTCATGTTTACTTTTCCTAAGCTTTTGCACTAT 

ATTGCTTAATTCCAG CTTTGAATGATATGATAAAAGAGTTTATCTCCATGGGAAGTTTGG 

TTGCACTGATTGCCACAAGTCAGTCTCAGCAATCTCTACATCCTTTACTTGTTTCTGCTC 

AAGGAGTTCACATATTTCAGTGCGTCCAACACATTCAGCCTCCTAATCAG GTAATACACT 

ACTTGTAAGGATTATTGAATTATGTCCCTTTTATAGAAATTATTTTTCAATTTTATTAGT 

AATTCGTGGCTTTAAATTTATGCTTCTCTTAATGATTTTAAGGATATGTAAGTCAACATT 

TGGTGCATATTGTGCTAGAGGCATAAATTATAATTTATAGCCACCTGAAATGTTAGTATG 

CGCTTTCCAAGAAAATGACTTTTTTGAAAATGGTATTTCTTTGAATGAGAAAGAACAGAG 

AGAAATAGATAGATGGCTTTTAAACACTTCATTAATTAAACTTTTTTTTTCCACCATCAC 

ATAATGGCACTTAGTCCCCTTTGGGAACTCATGAGGGTTTTAGTGGTAGTGAGCTGAAAG 

AAATATGTTCCAGGACTGGCAAACATATTCTAAATTCTTTAAAATTTTCACCTAGCATCT 

ACCCTAAATATTCAGACCCTGTGCTAGTTAACTGCTATTGAAGAACAAAGGTATTATATC 

TATTATTAAGGATAATAGAATGGTATTTGAGATATTGGTCATTGAATATGAATATGTTTT 

GAGAAATAAGTTTTATAGGAACCAAAAAAAAATTCTTAAAGGAACCATATATTACTAAAA 

ATGCTTCTTATTGGAGAAAGAAATGACAATCATTTATTAATGTGATTTTTTCACAACTTT 

ATTAAGATATAATTTAAGTACAACAAACTCACATAAAGTGTACAATTTGATCAGTTTTAA 

CATATGTAGATGCCATGAAACCATCACCACAATTAAGGAAACAAACATTTTCATCACTCC 

AGAAGTCTCCTAGCCCTTTTACTACCCATTCCTCCCCTGCTCCATCCCCAGACAACTACC 

AATTTGCTTTCTGTCACTATAGATTTGTCAACCTGATTTTCTCCAAATATACATTCAAAA 

ATATACAGTTGAATACAATTGGAAATTCGAATTTTGTGTTTTTTTCTTTAGGAACAAAGA 

TGTGAAATTCTGTGTAATGTAATAAAAAATAAATTGGACTGTGATATAAACAAGTTCACC 

GATCTTGACCTGCAGCATGTAGCTAAAGAAACTGGCGGGTTTGTGGCTAGAGATTTTACA 

GTACTTGTGGATCGAGCCATACATTCTCGACTCTCTCGTCAGAGTATATCCACCAGAGAA 

AGTATGTTTTACTATTAAAACCTGAACTTGGAATCTTCTTTCTATTGTGGAGAAATGTAA 

TTGTAGTAAGACAAGAATTAAATATATTCCATTGTAGTATTTGAATAAGCAGTTATTTGA 

GTAGAAAATTAGTGTTTCCAGCTAAGATGATGGCATATTTTGAAAATTCATATAGTGAAT 

ATAACTAGTAAAAGAAGTTTTGTTTATTTTTAAACAG AATTAGTTTTAACAACATTGGAC 

TTCCAAAAGGCTCTCCGCGGATTTCTTCCTGCGTCTTTGCGAAGTGTCAACCTGCATAAA 

CCTAGAGACCTGGGTTGGGACAAGATTGGTGGGTTACATGAAGTTAGGCAGATACTCATG 

GATACTATCCAGTTACCTGCCAAG GTATGTTTAAAAAAAGAAAAAGTGAATAPTTarTnr 

CAGAAGAACCACTGTATTATTGGCTTTGGCTTTATGTGTCAGCTTGCCCAATCTCCGTGT 

GAGTCAACAAGTGTTTACTGAGTTACCAAATAAATGTCTTAACACTATTTTAGGTACTTT 

AACAAATTTTAATTTTATTAATTAATTTTTTATTAGAATTGAGACCTCACTCTGTCATCT 

AGGCTGGAGTACACTCACAGCTCACTGCAACCTCAAACTCCTGGGCTCAAGCAATCCTCC 

TGCCTCAGCCTCCCCAGTAGCTAGAACTACAGGCATGAACCACCATGCCCGGCCAACTCT 

TTAATTTTCTTAGAGACGGAGTCTTGCTATGTTGCCCAGGCAGACAGATTTTAATGTGTA 

TGATGCAGTCTTTGATGATAAGAAACTTATAATGGAAAGCTGAGGTGATAGTTACAGTAA 

ATACATTTTGATGTATAATTCTGTTTGCTTTAATCATTCAAATTGTAGTAAAGCAAGATG 

AACTGTCTGCTGGGATTTGAGCAGAAATGGATAGGAATAAACTAGGAGGTAGAAGAGTTA 

TCAAGGTTCACAGGACTGATGGGTGAAGCTAGATTTCCAGACCCGGGATGTCAGTCCTTG 

AAAAGCAGACTTGGCAGGCATAGACGAGGCAGATAGCAGGATAAAGGAGACAAATGTAGA 
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TTGTTCTTCAGAAGATCAGATGGTAGAGTCTAGGAGGTAGTGTGTTTTAATCAGAGATCT 
GAGAGGCAAAGATCATTGCATGAGATCAGGGACCCATGCAAAGGAGTGAGAAAAAAAACT 
GGGTTAAGGAGCCTGCTGCATGGCAACTCCTGGGAACAGTGGCCACTGGGGCCTGGGACA 
TGTTGATTGCAGCCCAGGACTGTTAAAACCAGTGTGAGAGAACATGGGTATGGAAGTACT 
AGCTAGCAGGATCATGACCCCGATGCTGGGATGGGGCATCAAGCATTAGTACATGGAGAT 
TCAGTACATCCAGATGCAGTACATGGAGACTATATGCGTAACTGCTGACTTTGGGCTTCT 
TTCAGATTGGAGCAGAGGTAGAGGTGAGTGGGAATATTCTCAATAGAGGGAACTAAATAG 
GCATACCTAATAAAGGAGACCAGGATATTGCAGACAGTAGCCTCATGTTTGGCTCACCTG 
TTCAAAAAGTTCTCTTGTTCTTGAGCAGTGGTGCCTTAAAAGGTAACTTGAGAAGCAGTC 
GATTATTTGTTCAGCCTGGAGACTCTTGGGATATTTTACTATCTTTGATTGAATAGATTT 
AAATGTACACAGCTCTCATAACTTGCCCCATGAAGCATATCCATGAAAGGCACTATACTT 
GTTAAAAGATTGGTTTGTACTTTTTAAATGTAGTACTTTTAATAAAACAGGAAAAATAGA 
AGTTCTGATGCAGTTATATGCATTTTATATAGAATGTGTTCTTAATTGGAAAAAATTTGT 
CGTAGTTCCTTTGAGTTCATTTACAGTTTTTAGTAGGAATTGTATTTTCTACTGTTGTAC 
TTGCTGTTACTAAAGAAAGATGGTCGTGATTACCATCTGAATTTTTTTTCTATACATTGA 
TCTTTAGCTGCTACTTAGTCATTTCTGTTTAGACTTGAGCTCTTTTTCATATTTTTTTTT 
TTTGTTTCTCAG TATCCAGAATTATTTGCAAACTTGCCCATACGACAAAGAACAGGAATA 
CTGTTGTATGGTCCGCCTGGAACAGGAAAAACCTTACTAGCTGGGGTAATTGCACGAGAG 
AGTAGAATGAATTTTATAAGTGTCAAG GTATGTTGTCTACTTATCTTCTTTTTTTATTTA 
GGTAAAATTAACATAAATGCAGTTAGCCATTTCAAAGTGTAAATTCACTGGCATTTAGTG 
CATTCACAATGCTATGCAACCACCACCTCTCTCTAATTTCAAAACTTTTTCATTCCACTC 
CTCCTCTTGCTTATCCCCTGGCAACCATTCATCTGCTTTTTGTCTCTATGGATTTGCCTT 
TTCTGTATATTTCATATAAAACAAATCATGCAATATGTGACCTTTTTTGTCTGGCTTCTT 
TCACTTATGTAATGTTTTCATGGTTCATCCAGGTAGTAGCATGTATCAGTACTTCATTCC 
TTTGCATGACTGAATAATGTTACCATACTTTGTTTATCCACTTATCAGTGGTGAACATTT 
GAATTGTTTCTACCTTTTGACTATTATGAATAATGTTGCTGTAAATATTCATGCACAAAT 
TTCTCCACGGATATGTTTTCATTTCTCTTGGGTATAAACTGAGGAGTAGAATTCTTGGGT 
CTTAGGGTAATTCTCTAACTTTTCAAAGAACCACCAAACTGTCTTTCACACCAACTGCAC 
CATTCCCACTAGCAGTGTGGGGGGTTCCTGATTCTCCACATCTTTACCAACACCATTATG 
TTTCTCAATTGTGGGCTAGTCTCACATTTGGAAAGCTAGTGGGAGCAGCGATCCATCTAT 
TAAAAGTTGTATGAAATTGAGTAATGAGCCACCTCTCTCTTGTAGGGCTTATTATGTTCT 
TGCTTAAGGCAATCTTCATGCATTGTGAACAGAATTATACATAAATGCTCAGATAAAAGG 
GCAAACCATTCTTAAAGGGAGTAGACAACTAGAGGCAGGAGACCATACTGAGGCAGGAAG 
CTGGGGTTTTTATGGTTCTGTTACTTTTGACTATATCTCACCATTGCTTTTGTCAAAGTG 

CAGATCATTTTGGGTAATGCTTCACAGTCCACCACTGGTGTGTCATTGTGGTCGCAGATC 
CAGTATCTTAGCTGTGTAATTTCAGACATCAGCAATATTAGTTTAACAAAGGGCAATTAG 
ATTCCAAGACAAAGGAATCGTGTATTATTCTAGCCTTATTCAAACTTGATTTATAAATCA 
GTTTAGTAATTTATTTATTTGTTTCTGTATTTATTTTTATTTCTTTGAGATGGAGTCTCA 
CTCTATTGGCCAGGCTGGAGTGTAGTGATGCAATCTTGGCTTACTGCAACCTCTGCCTCC 
TGGGTTCAAGCTATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCTAATTTT 
TGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTTGT^ACTCCTGAC 
CTCGAGTGATCTGCCCGCCTTGGCCTCCCAAAGTTCTGGGATTACAGACGTGAGCTACCG 
TGCCCAGCTCAGTTTAGTAATGTATAACTGGGTTTTACCCAGTTGTAAATTACTCTTTTG 
TCGTGTTTTTTTGAGAACTGGCAATGACGGAGAAACTAAAAGTGCCAGGCTGTTGCCTTG 
TTCCTGTTATTTTGCCTTAGTTTTTTTTTTTTTTTTTTTTTTCTCTGAGACTGAGTCTTG 
TTGTGTTACCAGGCTAGAGTGGAGTGGCATGATCTCGGCTCACTGCAACCTCTGCCTCCT 
GGGTTCAAGTGATTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCGCCTGCCACC 
GCACCCGGTGAATTTTTGTATTTTTAGTAGAGACGGGATTTTACCATGTTGGCCAGGCTG 
GCCTCGACCTCCTGACCTCATGATCCACCAGCTTCGGCCTCCCAAAGTGCTGGGATTACA 
GGCGAGAACCACCGTGCCCGGTCTTGCCTTAGTTATTTCTTGTTCCCTCCTCTAGTCCTA 
TAGTTCTCTGACTGTATTGAGGAAATGTAATTAAATATTATTATGTTAATAGATATTTAT 
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GTGGTTGAATATTAGAAATTCCTTATTTTGGTCACATATCCTGATCAGTAGTTGGTCTTC 

TGGAGATAGTGATTTTTCACTAGAGATGACTTTAGGACCTATTCAGGTTTTTTTTAAGAT 

CCCAATTTAAGGAAAGACTATTCTCATTATTGATTTTGCTATATGCAGGGAAATTTATTT 

CGAAAGGTTTTTCAGTTGGCTTTTAGGGAAGATTATATATTCTCTTTTTTTTTTTTTGGC 

CTTTTCCCACATGTTCTAAAAATGATATATTCTTTAACTCCTATGAAAATACATTGTTTC 

AGTAATTGAAGATGCTGATTAAAGTCATATCTCTACACATTTTTTAAAATTTGAGATAGA 

TGGGACTTTGTCCCTTCTTACACCATTCACTTATTCACTTGGAAAAACTATTATCCAATA 

CTTATGTGGCAGACACTGTTTCTGGCACAAGGGATTCAGCAGTGAACAAAACTGCCTTTT 

TGGAGTTTACATTCTACTAGTGGAAAGCGACAACAAGCAGATAGACACATTCAGTATATA 

ATTCACTGTCAGATGGTGGTGGTAAGTCCTATGTAGGAAGAAAAGCAGGGTAAGGAGGCT 

TGGAGTAACTGGAGTGAGTCATAGATGGACTTGTCAGGAAAGGGTTTCTGAAGAGGTGGT 

ATTTGGG CAGAGATCTAAATAAAATG AAGCAACAAG C CATGAGAATATC CGGGGGAAAAT 

GTTCTGGGCAGAAGCATCAAGCATAGAACTTGTGGTATGATATTTATTCTAGCACACATT 

AATTTTAAAAATGTATAAAAGACATCCATTTAATCATATTAAAGATTTCCATGATTCATT 

TAGACTTAGTCAGAAACCAAATTTATATTTTCTTTTTAAATAATTTTATCTCAACTCTTA 

TTTTAC C CAATAG GGGCCAGAGTTACTCAGCAAATACATTGGAGCAAGTGAACAAGCTGT 

TCGGGATATTTTTATTAG GTTGGTAGCCTATGAATGTTTTTAAAGTAACTGACTCTGTTA 

TTATTTATCAATCAGTGCTTTTTTTGGTCTTGTTTTTTGAAGAACTGATATTTGAAACCT 

GTGGTTTATGTGAATTATTAATAAGCTAGAGGACGTGGATTCTCTATTTCATCAAATAAT 

ACAAAACATTTTAGATATTAAATTTTGGAAATTATTTGGTTTTGTTTTACAATAGAAATA 

CTCCTCAAAGTGGAATCGAAGTGGTTATTCAAAGAAATCTCAGAGTAGATTCTTATATGA 

AGCAAATAATTGCCCCTAATTTATCTCTAAATTTTGTAAGTTCTAAATTCTTTTTTCCCC 

CAGTTTCTAATTTATCTCTTATAAGTCAAGAGTCCATCTGGCCAATTTAATTTCAGTGAG 

TGTAACTATTTTGCATATATTAAAAAACTGTATATGAATACAGAAGATGGTATTTAAGGA 

TGAAAATAATTATTCAAATGTGATAGCATTATGGGGAGTTTTAAAATAAAAGTTACTGTT 

TTATTCTTCCAAAAATTTTATTATAAAGTATACAGTTAAGAGAATATACATAAAATACAT 

ATGCAGCTTAAGGAAGAATAATAAAATGAATACTTCATGTATTCACCACCGAGTTTACCA 

GGAAAAAGCATAAACAAAATAAACCTCTTCCACGTAATTCCTGGGTTAAAGAGAAGTTAT 

AGTGGAAAATATTTGGGAGC AAACGATAATGAAAAT ACTAT C CATT AAAAT TGTTAGATG 

TTGCAAAACTGATTTCAAGGAAAATTTATAGTGTTAAATGTTTAGAAAAGAAAAAAGGTT 

AGAAGTTAACCACTTATGTATCTATCTCATGAAATTAGGAAAATTATAGATATAAACTAA 

AAAATATGTTAAAAGGGAAATAATAAAGATAAGAATGAAGTTTAATGAAACACAAAACAG 

AGAAG CT CACAAAG C CAAGATTTATTTTTTG AAC AC CGAGT ACAATTGACAAAT CT CTAA 

CAAGTTTGATTAAGAAAAAAGAAAGCATGAATAAACAATTTTAGGGATAAAAAGGGAAAC 

ATCGCTAAAGATATC C C AGAAATGTAAAAGATAATAAGGGAAT ATT ATGAAAATATTC AT 

GCCAATACATTTGAAAACTTAGGTGACATAGACAAAAACAAAATTGACCAAAATTGAGCA 

AAAAAGAAACAAAATCTGAGTAGTCCTGTAACTTAGTAAAAATTGAGTTAGAAAAGTTAA 

AGAAGTCTTTACACAAATCAAACATCAGACTCAGTTTTCTAGGAGAGTTTTGCCAAACAT 

TCAAGTAGCAGATAATT CTGGTCTATTTTTGGCCCC AGAAG AT ATATTTTACTTGCCATG 

CATTTAATGAGATAGCTGTTGATTTTTTTCAATCACCGTGACAGGTGTTTTATATTAGGT 

GTTATTCGCCAGACATCTAGTCCACCTGTTGCCAGATATGGAATTAATATTCACTTATTT 

TGAATTAAAATTTGTTAATAAATTAATAAAACAAAGTCAAAGTTCAAATTATTAAAAAAG 

TAAAAGAAATAAAATATATTTTATAGAGAGC CCTTACAAAACAGTAC CAACATAATGAGC 

TTTCCAAATTTTGAATGGGCAAAATAAATGAATAGGCATTTCACAAAAGAAGGAAGGGTG 

GCCAATAAGTATATATTAATATAAAAATGGTTACTTGTAATAGGAATCAAAAGTGTTTGA 

CTTATTGACTAAGAGTCAGTTTTTGTTTTGATCCCTGTTAGTCTATCCAGAAGGCATGGG 

TCTTAATAAACACCTTGACCTCAACAGTTTACTGAATACAAGGGTAATTTCATATGCCTT 

GCCTTCTTTAAGGGTTTGTTGTAAAGATTAAAATAAATACATAAATATATATAAATACAT 

TTATATGTATTTATATGTAATTACATACAACTTGCCTTCTTTAAGGGTTTGTTGTAAAAA 

TTAAAAGAAGTATATAAATATATATAAATACATAAAATAAATACATTCATATATGTATAT 

GAAATCACTTTGCCAACTATGAAGCCTGATTCAAATATGAAATGTTGTTTGTTTTTCCCA 

GAGCACAGGCTGCAAAGCCCTGCATTCTTTTCTTTGATGAATTTGAATCCATTGCTCCTC 
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GGCGGGGTCATGATAATACAGGAGTTACAGACCGAGTAGTTAACCAGTTGCTGACTCAGT 
TGGATGGAGTAGAAGGCTTACAGG GTAATAATTATAAATACAGAAATAGAATGTTATAAC 
AAAATGTCATCATGTCATCAGATTTTGGTAAAAAAATGTTCTTTTTTCCTCTAGGTGTTT 
ATGTATTGGCTGCTACTAGTCGCCCTGACTTGATTGACCCTGCCCTGCTTAGGCCTGGTC 
GACTAGATAAATGTGTATACTGTCCTCCTCCTGATCAG GTGACAATTTCATATTTAGAGT 
CCAAAACCCAACAAATGCTACACTCTTTCCTTGTGAGCTTTACTTCTGCCAGGTAATGGC 
AATTGTCCTTAGAAGACCAGCTTTCTTAGGGAAAAGCTTTAGCCACTGTTTGCTCAAAGC 
ATAAAAAGATTCTGAATTAGATGCAAAGCCTTTTTTTGGCCCAGTGCAAGTCTGAAAACT 
TTGTAATCCTTCTGTGTTGGCTGATTGGGGAAAAAAAAATGCAAGAAACCTAATGTATTA 
TATTTTCACATTATCTTCTGTTCAAAGATTACATACTTCCATTATCCTGTCAAAAAAAAA 
ACTCTGATACAGAATCAAGCATGTGAATCGTAAGCATGTAAGCAGGTTTCATAGAGATAA 
TTTTTCAACTCTTCCTTGTCCTGTGTTGTTCCAACTCTTATTCTCCAATTTAGAAGCAAA 
CAAATAAATGAATGAAAGAACAGATAGACAAATGAATAGTCAAAGGTATAAAGTATCTGT 
ATATATGTTACATGTAGCTATTATTTAAATTATTTAGATTTTCCTTTTGAAATACCTTCT 
TGGCACACTTGCCTAAATCTAGAAAATAAGCACTGTGTGAATAAGAAATTATTTACACTG 
AATATTTTGTAGGTTTTTGGGTTTTTGTTTTTCAGACAAGGTCTCACTTTGTCACCCAGG 
CTGGAGTACACTGGTACGATCACAACTCACTGCAGCCTCTATGGCCCAGGCTCAAGCAAT 
CTCCCCACCTCAGCCTCCCGAGTAGCTGGGACCACAGGCACACGCTACCATGCCCAGATA 
ATTTTATTATTAATTTTTGTATAGAGATGGGGTCTCCCTGTGTTGCCCAGGCTTTCTTGA 
ACTCCAGGGCTCAAGTGATCCTCCCACCTCAACCTCCCAAAGTGTTGGGATTACAGGCGT 
GAGCCACCATGCCCAGCCTTAAGAGTGTTTGATTTTCATTCATTTTCCTATATATATTAT 
TTCTGTTGGGGAAAAAATTCCAAGGAAGATAAATAGTAGGCTGTTGGTACATTTCTCAAC 
TTACTTATAAAG CTTTTTAGATATATAAGGT TAATTTATGAAGAAAATC ATAAGAT AC AC 
AATTTAAGATAATATTTTTAATTTTATTTTTTATTTGTTAAATAAATTTTTCTCCTTTCA 
G GTGTCACGTCTTGAAATTTTAAATGTCCTCAGTGACTCTCTACCTCTGGCAGATGATGT 
TGACCTTCAGCATGTAGCATCAGTAACTGACTCCTTTACTGGAGCTGATCTGAAAGCTTT 
ACTTTACAATGCCCAATTGGAGGCCTTACATGGAATGCTGCTCTCGAGTGGACTCCAGGC 
AAGTTAT ATGAGGAAGT TGTTATGACATTTT ATGAGTGATAAAAGAAGT AC AATGT C AAA 
ATTTCCACCTTAAAAAATGCTATTTTTTAAACAACTTTGGTAAAACTGTATAGAAACATA 
AATTTACCTTTAGTTGAATGTTCCATAGTTGGAATATGGGTTTTGCAGAGAATTTATAAT 
TATGAAGTTTGATGTCTGTTTCTTTAACATTACCTTAATATTGGCAAAAACATGTTGGTG 
TTTGCAAGGATATTATTTAAATTGGGATACCATGAATTAAATACTACAAACAAAAATAAT 
TAGAGTTTTTTGTTTGTTTGTACTTTAACTTTTAAAAAATAATCAGTTAAAGTTGTTGTT 
TTGAAGCTCACATTGTTCCAATCTGGCCAATAGGAGCCCCTTTTGTATGGCTCCTGTATC 
TTTATGACATGTCCTCATCATTCTTGAATCACTTCCTCACTTCCAGATACAGTAAGTTAT 
TCTTGGCCAGGTGCAGTGGTTCACGCCTGTAATCCCAGCACTTTGGCAGGCCAAGGCAGG 
AGGATCATTTGGGCCTAGTTTGAGACCAAATCATGGTTGCACAAACTGTACCCACTATGG 
ACAACAGAGTGGGATCTTGTCTCTGTGAAAAATTTAAAAATTAGCTGGGCATGGTGGCAC 
ATACCTGTAGTCCTAGCTTCTTGGGAGAGGCTGTGGCAGGAGGATCGCTTGAGTAAATCC 
AGGATGCAGTGAGCCATGCTTGTGCCACTGCACTCCAGCATGGATGACAGAATGAGACCC 
TGCCCCCAAAAAAGAAAAATATTCTTGGTTTATCTTGTACTTTCTGTATCCCAGCCCTAG 
CATCAGCCTTTTCTCTAAAGACAGTATTATGATTTTAATATTTACAGTAGATATTTGAAC 
TGTTACATTATAGACTTTACCATATATTTTCTAGGAAGGATTATTCTATTACTCTTCTTT 
ACCACATTTGTTTGGAATGTCTACAGAACCTACAGTTTCTAAATCAGAAACTCCCTAGGT 
TTTTGCTATTTTGGCAAGCCATTGAAGTTCTTCCCTCTCCCTTTACTACCAGAAAGGTGT 
GTATTTGTAGAGCTCTCTATAATGAGAAAGCACTCTATAACATGGTTGATTCATCATTTT 
GGAGTAGAAAAGTATGAATGGAAAGTCAGAGACATAAAAAT AAAG C CC AGAGGT CTG AGT 
CTTAGCTTCATTACAGACTTTCTTGGGGGATGGTTGGTAAATTATCTACACATTCTATCT 
TGTCTTTATAATTTTAATAGTTAAATTTTTACCATGTGCCTCAAAACCGTTAGAGAATTA 
ATGAGCTCTTTGAAAAATGCTTCTAAGTTTCTTGTATTGCTCTAATAGAATGCTATCTAT 
GTTATTATTTATTTCTGAGACTAAAATTGTTTACATCTTTAAACTGGTTGTCCTTTTGTG 
TATTTTAG GATGGAAGTTCCAGCTCTGATAGTGACCTAAGTCTGTCTTCAATGGTCTTTC 
TTAACC ATAGC AGTGG CTCTGACGATTC AGCTGG AG ATGGAG AATGTGG CTT AGATC AGT 
CCCTTGTTTCTTTAGAGATGTCCGAGATCCTTCCAGATGAATCAAAATTCAATATGTACC 
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GGCTCTACTTTGGAAGCTCTTATGAATCAGAACTTGGAAATGGAACCTCTTCTGATTTG G 
TATCTTGTGCAGTCATCATTATACAGTTCTGAAATATAAAGCTATATGTTGGTGTAAAGT 
TGCAGTGATTTCTCTCCTAACCAGCCCCACATATTCTTCCTGGTTGGTTGGTTCTTCAGT 
AAAATAGTCTTGTTTCTTGCTTACACTAATTGGTAATTTGCATTCCTTGTTAAGATTTTC 
AAGACAGGGCTGGGAGCAAGGAACCAAAGTAGCGCGTGGTTGTGATTACCTTTGGTTTCT 
TTGAGGTTTCTCTTACCTAGTGGCTTTAAAACATCTTTAGGAGCAGTTCCATTTTATAGT 
AAACTTAAATTCTGTTATCATGAACAGTTGAGGATAATGAATAATTTGATACAATAATGT 
AAGAAATTCCTGAAAACAAAGTGTTATCTGTGATACTTTTGCTGCATAGTAAGCACAATG 
AAGTGTACTGATAATGTTTCAACAGGAAAGTGTTTTGATTAAATGTGGGCAGTATCACTG 
TTCTACTAGCATTCAACATCTCTTCTAAAAATTAATAGTGGTTCACTGTAATTTTATTGG 
TACATGTAACATCTGTACATGTGTTTGGTTATCTATATGTTTCCTGGTTTTTTGTACATT 
TGCTTTATTAATTTAGGCTTTTTTTTTTTTTTTTTTTTGAGACAGTCTCACTCTATCATC 
CAGACTAGAGTGCAGTGGCACAATTATGGCTCACTGCAGCCTTGACCTCCTGGGCTTAGG 
TGATTCTTCCACCTCAGCCTCCTGAGTAGCTGGGACTACAGGCACATGCCACCATGCCCA 
GCTAATTTTTGTATGTTTTGTAGAGACGAGGTTTCACCATATTGCCCAGGCTGGTCTCAA 
ACTCCTGGGCTCAAGCTATCTGCGTGCCTTGACCTCCCAAAGTGCTAGGATTACAGGTGT 
GAGCCACTATGCCTAGCCTAACTCAGACTTTAAAAATATAAAAGCAATTCATTTTTATTC 
CCAAGAACAGTAAGGTGGTGGTTTAATTTTAGTCTTTAATTCTGTTTTTAATTTATTCTA 
TTTAGAAATGTCCCAGAAACTTAGTATAACTTTACTTTCTGAAAATGAAGAAACCTGTCC 
TTGGGCATTAGTGTGTTGGATTTAAGCAACAAAGTTAAAAAAACCTACCCTGTGTTATGG 
CAATTTTCACTTGATGGTGGTTCTATAACACAGGTATCAGTGAACCTTTATAAAAGATGA 
ACAACTTTTCAGCTTGCTTAATTTCAGTTAATTAACATGTATACTTATCTATGTTAATGT 
TTTATTGCTTAAAATGTTTAATTTTTATATTTGGTAAACAGATAGTTTTTTCTCTCCCCC 
TCTTCCTTCCATCTTTCATTACTACAATTTACCATGCAG AGCTCACAATGTCTCTCTGCA 
CCAAGCTCCATGACTCAGGATTTGCCTGGAGTTCCTGGGAAAGACCAGTTGTTTTCACAG 
CCTCCAGTGTTAAGGACAGCTTCACAAGAGGGTTGCCAAGAACTTACACAAGAACAAAGA 
GATCAACTGAGGGCAGATATCAGTATTATCAAAGGCAGATACCGGAGCCAAAGTGGA GTA 
TGGCTTTTTCCCCCTCATTATAATTGTTAAAACTTCTTAAAAATTGTTTCACCCTTTTGA 
TATATATTTCTTTGACTTATAAACGAGCTATATTTATAAACAAGGGACCAGAACACATTA 
ACTCAGTCATGGTTATGTGCTTCCTTGCTTTCAATGTTTCATTATCTTATAAGGAAGAGA 
ACGTATGGTCTCTTGAAAAAACTGACAATAAGAAGTAACAACTGGACTACCACATTTTTT 
TTTACATCCTTAATTTAACTCTTCGTCAATTTCTTTTTTTACTTAAG GAGGACGAATCCA 
TGAACCAACCAGGACCAATCAAAACCAGACTGGCTATTAGTCAGTCACATTTAATGACTG 
CACTTGGTCACACAAGACCATCCATTAGTGAAGATGACTGGAAGAATTTTGCTGAGCT GT 
AAGTAACAGATTCTGTTTTGGAAGTACAGCTACTATTACAAGTGACATAGTATTACACTT 
AAACCTTTAAAGTTCGTGTTTAAAATAAAAATATTTTGAATATTTAAAAGCTAATTCAAA 
AAATATGTGT CGTAGCTATG C ATTAAAAAAC C CCAAAATGTCAGAAGTACAGAAGT C AAA 
ATTGAGTTTTCATTAACCAGTTCATTTGATTATATTTGAATTATTCATAATGGACTCATT 
TAATTTTAGTAACTTTGGGCTGGGTGCTGTGGCTCATGCCTGTAATCCCAGCTCTTTGGG 
AGGCCAAGGCAGGTGGATCACCTGAGGTCAGGAGTTCGAGGCAAGCCTAACCAACACGGG 
GAAACCCCATCTCTACTAAAAATACAAAAATTAGCCAGGTGTGGTGGCATGTGCCTGTAG 
TCCCAGCTACTTGGGAGGCTGAGACAGGAGAATTGCTTGAACCCAGGAGGTGGAGGTTGC 
AGTGAGCCGAGATTGCACCACTGCACTCCATCCAGCCTGGGCCACAGAGCGAGACTGTGT 
CTCAAAAAAAAAAAAAAAAAATTTAGTAACTTCGAAGAAATAAGAAGGAAAATTAAAAGT 
TGAAAGTGATTCTAATGTATAGTTTATAAAATTTTGTTATAAAAATACCTGTTTTGCCTT 
CAAAATAATTTATATTAATATTTTATTGACCTCAAGAACATTTAAATACATTCAGATTTA 
TTCATTTGTGGACCACATTTGTTATACATTGGATTTAAAGGATCCTTGCAATTGAGTTTA 
TGGCCACCTATGCATCTGAGACCCATGGACTGGGAACCATTCTAGGTCAATGATTCAGTG 
TGATTCAATTTAAGAGATGTTTATTCCTGGTCTTTAGAAGCTGCTACCTTTTGTTATCTA 
ATTTTGCAGTACTTTGAAGTATGTATGTATGTGTACATACGTTAGTGCTATGTATTTATT 
AAAGAAGAATCAGAAAACAGAGGTAAGGAAAAATAAGGAAACAAATTTCTGTTAAGCCCA 
CCACCTCCCAAAGCATATTTGTTTATATGCTTATATATGTTTTCCTATTATGGTAAGAAC 
AGTCTGTACATATTGCTATATAGCAGTCCCCCTTTATCCACATACATCCTGAAAATTGTT 
TTACATTTTAAATGTTAACTACTTTATTGTTTTTAAATGTCATTTTATAGTGTAGCTATG 
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CCACAATATCCAATTTTTAGACATTTAAATTGCTCCCAGGCAATGTGGTAATGAACATTC 

TTGCAGCTGAATATATGCACATATCTAATTGTTTCACTAGGATAGAGGTGGAATTGTATA 

ACAGGGAGCTCACATTTTTTAAGGCTTTTGAAATGTATTGCCAAATTGCCTGCCAGATAT 

ACTGCACCATCACTAACATTGTGTGTTGCAGTATTTTTCTAAACTTGGCCCTTTTGATTT 

TAGAAAAATGATATCAATAATTTACATTTCTTTGATTAAAGTGTAGAAGTTATAATTTTT 

CATATTATTCATTGTCATTTGTATTTTATCTTTTCTAACTTGTCTCTTCATCCCCTTTGC 

TCCGTTTTCTATTGGAGTGCAACTTTATTTGTAAGAATTCTTTTTAATTTCTGTGACTGG 

AATTTTTTTTTCTAGTTTGTTATTTCCCGTTCATTTCTTAAAATATAATTGTGTTTGCCA 

ACAATCCATTATCTTTTGTTTTGTAATGGTAGTATTTATACATATTAAATTATCTCTTTC 

TTTTTTCAG ATATGAAAGCTTTCAAAATCCAAAGAGGAGAAAAAATCAAAGTGGTU^CAAT 

GTTTCGACCTGGACAGAAAGTAACTTTAGCATAAAATATACTTCTTTTTGATTTGGTTCT 

GTTAAGTTTTTTGATGGCTTTTCCATATGTTGTAACAGGAAAAAAATGGTGTCTATGAAT 

TTCTTCTTAATTTAACAAATTTGGTTAATTTATAAAATCACAGATTGGTAAATGCTATAA 

TTATGTAATGATCAGGATTGAGATTAATACTGTAGTATAAATTGGGACATTATAACAGAT 

TCCATATTTTATTTCCTAAAATCTAAATTCAGTCTTTAATGAAATAATATTAGCCAAATG 

GTGGAACTAATTTATTTCTTTTGAGGAAAAGATAATAAAGAATGTAATTAAATTTAAATT 

TCTTGGAATTCCCAGTTGTATATTCATCACCTTTGTAGCATTTGACAAATTTTATGCTTA 

GCAGCTTCTTCACTGTTTTGAAATAAAATATCCTATTACCTACTG ATACAATTATCTGTT 

CTTTGTATATCAAAAAATGTGAAATTTACACATAATTCAAATACATTTAATTATCCGCTC 

AACCAGAAATGAAATCACATCCCTCTACTATACTACATCCAGCTCCAAGCCCAAGATATT 

TAAATGACATCCATTCCTCTCCTAGTTCCAGTTATGATTTTATCTTGATATTCTCTCATA 

TATGAAC TAAATTATAAAGTTAGC CACCAT C AATAC AATCTG CGTAT CTAAT ATCTT AAC 

TATATAGTAATGGGGTAAGGGAACAGCAAAAAGGAGAACATTAATTAAAATATACAAGTA 

AGCCTGGGCAACATAGTGAGACCCCATCTCTTAAAAAAAAAATTAGCCATGCATGATGGT 

ATGCCTCTAGTCCCAGCTACTTGGGAGGCTGAGGTAGGAGGATCACTTGCTCCCAGGAGG 

TTCAAGGTTCTAAAC C AGCAAAGCTC AGAAT CCCAGGGGATAGAAACAAAGACTTAGTGG 

ATCACTAGTATTAAACTGAGACACGTCACCCTGCATTGCACTTTGTTTCTCAGTTCTTTG 

ATGAAATCACTGAGCTGACATACCTGCCCTCTTTTCACCATAAAGTGAGTTTCATGATCA 

GAAGCAATGTCTATGGGATAGCCTAACAAACAATGTAAAAACCATTTAGTAAGTTCATGA 

AGGGTGGTGGTGGTAAAAATTTGGAGAACATACAAAACAAATACAATTCCAAGGTGTGTC 

CCCTCCAGGAAGGACAAATTGCTGCCTGCTCTGTGATAGAAGAGGATCAGATGTAATCAA 

CCTGCCGTCAGACTTGGGCTGTTCTCTCCTGGGTGTGGACTTGCCTGGTTGGTCACTGCT 

GCTGACAAGTAGGCTGTCAATATAGCTGGGTTGTCATGTCAGCTGTGGTGAGGGGGAAGT 

CCACATTGTGGAGGCCACATCCCTGCACTCTTGGCCAATTTGACCATGAATCTTAAGCAC 

TGGGGTGGCTGGAAAAGACAGCCGATTGACATCCATACAGAGGTCATCTTGACCACTTGA 

TTAGTATAAGCACTGAAGGCTTTTAACTGAGCATTCACATAGGACACAAATATTCTGATT 

CTTTGGGCCCATTCCAAGAACTCTGGGCATACTTTTCCTCCAGACCTCATACCCAGTTGT 

GTTCTTTCCAAATTTCTGGTCATCTGGTTATGTTATTAGCCACTATCTGTGAATCAGCAT 

AGATTTTTATATCAGACATCTCTACCTCCTGACAGAATGGAGGAGATATGTTACTTAACA 

ATTCTGTTCCCTTGGAAGATTTCCTGTCTCCACTGTTTGTAAGGGCTACTCCCTCAATGT 

AGCAGTAATGCTTTCACTCTGATGGGAAGTCACAGTGGAATTCTGGGTCTCCAAGAATTA 

GTGTTAGTGCATACACAGTGTCTGATAATCCCCAGAGTGTCTGGTGCCCTTGGATCCTGT 

GAAGAAGGCTTGGAGAAAAGAAGATTCATGGCAAGAACTTGTGATGTGATGACAGGGCCT 

TTTCTCTGGCTCTTCATTCTTAGTCTGACCTAGGTGTGAGAATTAGGTCAGGGGCCATGA 

CTATATTGTGGTGACTCAAACCAGGCCTTTGTTTACTAACTGGGAGATTTTTACATTGTA 

AGAATCAAGTAGGATCTTTGCCCATGTATTTTGGTCTTAAGAACACAAATGATATGGCTC 

CAATGACTGGAGGAACACCAGGGTCCTTGGTCTCACGCTGATTTAGATAAAACGAC TGTC 

AGGCCTCTGAGCCCAAGCTAAGCCATCCTCCCCTGTGACCTGCACGTATACATCCAGATG 

GCCTGAAGTAACCAAAGAATCACAAAAGCAGTGAAAATGGCCTGTTCCTGCCTTAACTGA 

TGACATTCCACCATTGTGATTTGTTCCTGCCCCATCTTAACTGAGCGATTAACCTTGTGA 

AATTCCTTCTCCTGGCTCAAAACCTCCCCCACTGAGCACCTTGTGACCCCCGCCCCTGCC 

CCTAAGAGAAAA CCCCCTTTGATTATAA TTTTCCA CTA CCCACCCAAA TCCTATAAAATG 

GCCCCACCCCTA TCTCCCTTCGCTGA CTCCTTTTTCGGACTCAGCCCGCCTGCACCCAGG 

TGA AATAAA CAGCCTTG TTGCTCA CA CAAAG CCTGTTTGGTGGACTCTCTTCA CA CGGA C 
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AAGCTTTAGTAGAGATCTCAAAAATGGTTGGATGGTAGCAAATTACTAAGAACTCTCAAA 

GTTTCTAAAGCCTTAGTTTCAGCTTGCTAGAAAACCTATGTTGAGTATTATGGCTAGTTC 

CATAGTTGAGTTGGGAAATGTCTTTGAGGAGACACTTTTTCACTTTGTATTCATCTGTAC 

ATTTTCTGTTACTTGCATTCTGTCATGCTCAGGCTATTAGAGCAGGTACATTTTTATAAC 

TGGAATGTTTATGTGTAGTGAAGCTCTGAGAGGACTTTGCATTAGATCTCAGCAGCATAA 

TCAGAAGGTTGTCCTTTGTCTCAGCAATTTTTAAGCTAATAGTAGCAGAAATTGCAGTGG 

AAATAGACTGCTTTGCCACAACATTCAGAAAATCATTTATCTTTTTATTGCAGTTCTTGT 

CACCAAACAATACATTTTAGTACTTCTCAAATTGCAGAACTCTCATAGGGCTGGGAAAAT 

GCCTGTAGACACATACATACTATGAATGTGCTAATGTTTTTTGTATTTTCATAGCCCATC 

AAAGCTCCTGAGTCAGTTTCCACTATAATCACTGCAGAATCAATCTTCTACAAGGTAAGC 

TTTTGTAGAGTTACTGAAGGAAGAGTTGGGCCTAGTGGGTAATGTGCCACTAAAATGTTG 

GATTAGTCTAAAGGTCTCTGCTACTCTTTATTTGTATAAGGTGTGATTATACTTTTTGTT 

CCCTTCTTAGCTGTTTTCCCCCATAAGTGGCTGTTATTAAAACATCTCATCTAGAGCTGA 

AGTGGGAGGAGAAAGTGCCTACTGACACATGATGTGAGGATCTTAAGTATTTTTTTTTAG 

TGTAGATTGTAGGAATTATTCTTAAAATGCTGATTGTATAGTGTGGAGCCATGGAAGACT 

GAGCCGTTAGTGCGATGGCATTGAAGAATGAGAAGGACAGAGACAGGATTTGGACTAGTA 

GAGGTTGTCGACTGTGGTGTCAAATGGGTAGAGTAGGCCCAGAGATTCTAAAATGCCTTT 

AAGTGGAGTTGAGCTGAGTAAGGGCAGTAGTGAGGATTAACACCTACTAGAAATTCATAG 

TGAGAGGAATTCCAAGATGTTTTGATAAAAGAATGAGGAGGTCAGGTTTCCCAGGGCCAA 

AGTCCATGAACATCTGATACCTCAGTGAGAGAAGTGACAGATTGTTGTGTTTAAACCAGA 

AGTCTTAGGAAAGGAATTAGAACATAGACCCCCAAGGCTCGGCAGGCCTGGCACGGCACA 

GGCAGCAACCATTGAAGGCTATTTGGTGTTTCGGGATCTGAACTGTCATTTAGGGGACAG 

TGGTGTGAGTTAGTACTTTATACTTGACCCAGGTGGACTGAGAAACTCAAGTGATGATGC 

CCTTAAGTATACTTTTTTTTAAGCCCACAATCTATATAGTCGAAGTCTGTTCCTCCCAAC 

AGGGGTACACTGGCATTCCTCAGCAGGGCTGGGAAAAACCAACAACAAAAAAAGTCTGTA 

CACAGGCAAACATCTCTCTTATTTTTCCAACATTTAATACATTGTTAATAAAATATCTAA 

AGTTTAGCAAACAGTTGCTGTGTATCAGTGGCTGAGCATTTTGCATGCTTTATTTCATTC 

AGTTCACTCTATGAGGTGGATACTACTATCCCCATTTTCTAGATGAGAACATTGAGGCAC 

AGCGAGGTTAATTAACTTGTCCAAGATCACATAGCCAACAAGTCATGGAGTGAGGCAGTC 

TCATGCCAGAGCTTAAGCCTAGAGCATAGTTCCTGGCTCTACAGCTTTAGCAAGTGACTG 

GCTATGTGACGAGGACCAACCTCTCTAATGTCTCATCTGTAAAATAGGAATTGTAAATAG 

TTACTACCTCAGTGGGTCAAATGAAATCATATGTGTTAAGCACTTAGCAGAGTAAGCACT 

CAATGAATAGTAGGAGTTATCACATCTTCGTATTTGTGCATTACCTTCACAGTTTACAGA 

TTAAGGCCAGAAGCAACTTGTTGAGCTACGGGTTTAGTGTACTAACAGTTTCCATGTGTG 

TCTCCATGGAAGGGTGTGTGGGACCTGTTATTGTGACTGTCTGTACTTTCGTATTGTTGT 

CTGCCACCCATGTTTATTAAATGATAAGGACAATAATGCAACAAAGTAGTCAAGTAATGT 

TGCAAATGCCCAGTATTGTAGTGGCTATCACAGCAGTGCCACTGGCAGGCAGCACCATGG 

TGGCAAGTTCAAGAGGTCACTGCCAGCCACTGAGCTAGAGCCCAGATCAGGCATGCAAGA 

GGAGCCTGAGTGGGAG C C ACTGGGGATCACGGC CAAGAGTGTGACCACC CAAGAC C CAGA 

ATGGCTGAGTGGCCTCCCTGGAGCATGGCAGTGGCAGAACAACTCCATGAACTCAGATCT 

GGTGATGCCTAAACTAGTGCTGTTCTCGTGTGGACCCCTTTTCTCTACCAGAAACCTTGA 

ATCCTCTCAGCAAATGAGGAGACTACTCAGATCAGTGACTTAGTCCTGTTTGGTGTTATA 

TATGTGTACACAACACAGCACATATTAATAAATACCTACTATGTGCCAGGCACTGCCTAC 

CACTGGAATCTTTCACTAAGACATTGTTTTTACTTTGCATTTCTGCCTTTACACTATGAA 

AGTAGATGTTTTGGATTCATATTCATTCAGCATACATTTGAATATGCTGTGTTATGCATA 

GTAAGCCTATGATAAGCAAGTATTCTCATTTAGAATTTGGGAATATTGATTATACATGTG 

GACAAACAAACCATAAATGCAAACTATTTATATGATAAATAACTTTGGACTGATGGCTGG 

GAGGAAGGACCAGCTATTGATGGGTAGGAACTAGCAAGTAGCGGACTGTGGCCTGCATAG 

ACCAGACC CATCCGTAGTGATCCAGATGAAACAGC C AC CCT C AG AC ACTTGG ATAAAGGG 

TCCACCAGGAAAAAACTCCTGGCCTATCAGGTGCTATGTTACAGTTCAGTTACTGGAAGT 

ATTTCCTCAAAAGTGTTTTTATGGTTGAGGTACACATTCCTACAGCTTTACCTGCTGCCA 
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AGTCCCTGTTTCAAGGGAAGCAGCAATGAATTACACTGTTCCCGTAGTCAAGGACAGTAT 

ATCTTACCAAGAACTATACCCACTTAAGGAGGTGCTGGATGTCATAAAGATTTGGATCAA 

CCATTATGGGTGTTCAGAGGAGAGATTATTTCCAGCTCAAGACCCAGGGAAGAGGACATA 

GGATGGATACCAGAGTCATAGGGAGGATTTAACACAGGACATGTACACATTAGTTAGTTG 

GGTATAAAGTGGAACAGAAATGAATGAGACACAAAGCCTTGAATGCCAGAAATACTAGTA 

GTCCTGTTGTGGAAGGATATAAAACTCAACTGGGAGTGGAAGAGAAAGGCAGCAGTGAGT 

C TAGG AGATGTAC AGTAGGTTG AGGTAAAC ATAT C C TG AAGACTATAATC C AAAGATT AT 

TTTTGGTTTGAATTTGTTTTGGTTTGAATTCATGGTATCTATTTTCTTTGAGTGGATGGT 

TGGGGAGGGTGGCATGTAGAATGCATTCTTACCAAATCAGCATGATTTTCAAGACAGTAC 

AGAGAAAAGACTGCTGAGCTGATGTAGGAGCTTTGGCTGCAGTCTCTATGGCTTTCAGCA 

AGCCGTTTAACCTTACTACTGCTTCATGACTGTGGCTAACAAAGTAGGGATAGTACGGAG 

CACAGAGGATTTTTAGGGCGGTGAAACTATTAATACTCTCTTTGTATGATACTATAATGG 

TGGGTACATGTCATTATACATTTGCCCAACCCCACAGAATACACAGCACCAAGAGTGAAC 

CCTAATGTGAACTCTGGTCTTTGATGATGCTATGTCAGTGTACGTTCATCCGTGTAACAA 

GTGTACCACTCTAGTGGTGGGAGGGGTTATTGATAATAGGGGAGGATGTGCATGTGTGGG 

GGCAGGAAGTATATGGGAAATCTCTCTACTTCTGCTCAATTTTGCTGTAAACCTAAAACC 

TCTGTAAAAAATAAAGTCTATTTTTTAAAAAGTGGGGATGGTATTACGGCAATATAAAAT 

CAAAATACTTTATGAACAAATCTTTTCTCCAGATGTAAACTGTCATATATGCACCCTCGT 

ATGTGTATGTATAATTTTCATTCAAACGTGAAACAACTTTAGAATTGGCACCAAACATAT 

AAACACTGATACATTAGACTATCTCGAACACCTTTTACTGACCACTTTGAAAACTTGCTT 

ACCTATTAAGGTTCATTCATAGCTGTG ATGTTCTATTTTTATTTTCAATGTGGGATTATC 

TTCTGTTTCCCCCAGGGAGTATATTACCAAATTGGTGATGTTGTTTCTGTGATTGATGAA 

CAAGATGGAAAGCCCTACTATGCTCAAATCAGAGGTTTTATCCAGGACCAGTATTGCGAG 

AAGAGTGCAGCACTGACGTGGCTCATTCCTACCCTCTCTAGCCCCAGAGACCAATTTGAT 

CCCGCCTCCTATATCATAG GTAAGTTTGACAAATGGCACAGGTTTTTTTTTAACTTAGTT 

AACTCTCCAATATTATGTAAAAGAGTGTGTTAGTCAGCTTGGGCTGTCAGGACAAAATAT 

CACAGACTGAGTGGCTTAAACAACAGAAAGTCACTTTCTCACAGTTGTGGAGGCTGAAGT 

CCAACATCAAGGTGCTGGCAACACGGATTTCTGGGGAGGCTTTTCTTCCTGGCATATAGA 

TGGTCACCTTCTTGCTGTGTCCTCACATGGCCTTTCATGGAGTGAGAGCTCTTTGGTGTA 

TCTTCTTATAAGGACACCATTTCTGTCAGATGAGGGCCCCACCCTTATGGTTTCATTTAA 

CCTTAATTGCCTCCCTAAAGGTCTCATCTCCAAGTACCATCACATTGGGGATTAGGGCTT 

CAACATATAAATTTGGAGGGTGGCGGGGGGGGATGCAATTCAGTCCATAACAAAAAAAGC 

ATGAGTATTATTAAGTACAAAAAAATTAGAGAGCTTTATAGAAAATATGAGGCATTTTAT 

GTAGCTGGAGTGTGAGTGCTATCAGTTATTTTGAGTTAGAGCAATGTGCATCTACTAAGA 

AGTGGTATGGATAAGATTTTTTTGGAGTGACCCAGGGTTAAACTGTACTACAAGAATGTA 

TTGCTCAGGAACTAGGTTATTTAGGTTACTTATTTATACAAACCTATTCAAAAATAATTT 

AGGAAAGAACTATCCCAGTTATCCCATACTTGCAAATTCTCAATATGTGTGCCTCTGCAT 

GCTACACATGTCATCTTAGGCCTTTATAGTATAAAGGCTGATAGTTGAAATGGCAGCTGC 

TGTGCTTTTGTTAATTTCAAAGCTGCCAAAACAGTTGTGAGATAGACTCACAAGAATTTA 

CTGATTAATACAATTTTTAAAGTTTTCAGATTTTTACAGTTACTTCAGACTTTTTATCTT 

TCTGCAGTGAGCATGCATCATTACTTTTGCATCCTGAGAACAAGCATAAGTGTGTTTTTG 

GAGAGAACTCCAGGGACAAATAATATACCACTGTTATTCTCACCTATATGTCAAGTTTGA 

TACATTACCAAACAATTCTAGCCTTCTGCTTATAAGTATATAGAATTTTTATTTACCTTA 

TCTATGGATCAGGATCTCAGCAGAGGCAGTGATGTATCAGAATCACCTTCGGGATTCCTC 

TACTGCCTCCTCTTTCTAATCCCCAGATTCTGATATGCATCCTTGTCCTACAGCGAGGCA 

GCATGGCATGAGGTCAGAACACCAGTTCTGGAGCCAGACTGTCTAGGTTCACAGCCTGCC 

ATTTACCGGCCATGTGACTTTGGCAAGTTTCTTAGTCTCTCTTGCCTCACTTTCCTCATA 

TGTAAAATGGGAATAATAATAGTGCCTACCTCAGAAGGTTGATGTGAGGAATGAAGGTAT 

TGATACATGTAAACTTAGAGCAGTGTGGGTACAAAATAAACATGATGCAAGTGTTCAATC 

ACTGTTTTTGGGAGAATGCCATATTCTTTAAGCCGTTAAAGAAGAAAAAATGATTAAGAA 

TAATTTC AAAGTAATGC ATGTTTCAAGGGCTAATGC C AGGTTGCT C CC AGAGTGGTCTC T 

CCCAGTGTCTAGAAATTTTAACATCTTATGAAAATGATATATATGGTCAAAAATGTATTT 
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AACCTTTCCCTTGGCTGCCTTCCAG GGCCAGAGGAAGATCTTCCAAGGAAGATGGAATAC 

TTGGAATTTGTTTGTCATGCACCTTCTGAGTATTTCAAGTCACGGTCATCACCATTTCCC 

ACAGTTCCCACCAGACCAGAGAAGGGCTACATATGGACTCATGTTGGGCCTACTCCTGCA 

ATAACAATTAAGGAATCAGTTGCCAACCATTTGTAG TTCACAAATTAAAACTGGGTTTCC 

AGGCCTGGTGTGGTGGCTCACGCCTGTAGCCCCAGCTATTGCACCACTGCTCTCCAAGCT 

GGGCAATGGAGTCAGATTCTCTTTCTTAAAAAACCACAAAAAAACTGGATTTCCAGTTCT 

CTAATATTCTTAGTACCACAAGATATGTCATAGGTATCTTTAAATGAAATTCTTAGCTGG 

AAAAGTGACTAAAAAGTTTTTCTCCTGCTACCTAGTAATAAACAAATCATTGTTTATTAC 

TGGTCACTTAGAAAATTAAAAGGGATAGGGCCAGGCACAGTGGCTTATGCCTGTAATTGC 

AGCACTTTTAGAGGCCGAGGCAGGCGGATCACCTGAGGTCGGGAAGTGGATCGCCTGAGG 

TCAGGAGTTCGAGACCAGCCTGGCCAACATGGCGAAACCCCGTCGCTACTAAAAATACAA 

AAATTAGCCAGGTGTGGTGGCATGTGGCTGTAATCCCAGCTATTTGGGAGGCTGAGGCAG 

GAGAATCGCCTAAACCCAGGAGGTGGAGGTTGTAGTGAGCCAAGATTGCACCGCTGTGCT 

CCAGCCTGGGCAACAGAGTGAGACTCTTGTCTCGGAAAAAAAAAAAAAAAAAAAAGGCTG 

GGCACAGTGGCTCACGCCTTTAATCCCAGCACTTTGGGAGGCTGAGGCAGATGGATCGCC 

TGAGGTTGGGAGTTCGAGACCAGCCTGGCCAGCATGGTGAAACCCTGTCTCTACTAAAAA 

TACAAAAATTAGCCAGGTGTGGTGGCGCACACCTGTAGTCCCAGCTACTCGGGAGGCTGA 

GGCAGGAGAATTGGTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCAGAGATCGTGCCACT 

GCACTCCAGCCTGGGTGGACAGAGCAAGACTCCGTCTCAAAGAAACAAACAAAAAATTAA 

AAGGGATAGAATATAATGAAATATATTTTGAACTTAAATTATATTCTATATGTGTATCTT 

CCTAGGCAAAAGCTGTAATTTCCAGAGAGACCATTAGGAACAGGTAGTATCTATTTTTCT 

CCATTATTTATTTCTAGAAACTCATAAAATGGATTGTATTTTTCTATAAGAACAAAATAT 

TAATTAAGGTATAGATGACTGACCAAGGGCTTAATCAAATAAAATGACTAACAGCATCTA 

TCATAAAGCCACACAAGCCTTATGTTCTCATCTCAAAAATGCTGTGACAGCTTTTTGGCT 

GCTTTAACCATAAGAAAAATGATTGGTGGATGATTTTATTAGCCCAGGCTTTTAAAAACT 

TTCATCTAGGCCACGTGCGGTGGCTCATGCCTGTAATCCCGGCACTTTGGGAGGCCTGAG 

TGGATGGATCACTTGAGGTCAGGAGTTCAGGACCAGCCTGGCCAACATGATGAAACCCTG 

TCTCTACTAAATATACAAAAATTAGTTGGGTGTTATGGTGCATGCCTGTAATCCCAGCTA 

CTCGGGAGGCTGAGGCAGGAGAATTGCTTGAACTCGGGAGGTGGAGATTGCAGTAAGCCG 

AGATCGTGCCACTGCACTCCAGCCTGGGTGATAGAGCAAGACTGTCTCAAAAAAGAAAAA 

AAAGAAAAAATTTTAATTT AATC CTT C TGT AG AAAC AGGC AT TC AG AAC C ATT C C ATTG A 

TCTTAATAAAGCTGCTCTTTACTGTTTCTAGTCAAAAATGAGACTTCGATCAAACCATAA 

GATTTTATACTGCAGATAGTCAGCTTCACCAAAGCCGCAGAGGAAACATGTCGAGATCAG 

GCTTCCTGCTTGATAGTCTCTTGACTACCATTAAAACGAATATTGGGAGGTCATGAAAGT 

CATTGGTAGGCCATTAGCATTGATATCTTTAAAACATCTACCCTAAACCATCTGCTATGG 

ACCCATAATAAGAGGCCTGTTGTATATGAA ATTGTCTAGAATTCAGGTGCAGGTCTTTGC 

CGGTTAAGTAAGGGAGCAACACGTAAAATGGGAGAGGAGTGGGGTGTACTCACTTGCCTC 

CTCTTTTGTCCTGATTTAACCAGCATTTTTCAACCCTGGGAAAATTTGCAGAATCTAAGT 

TGATTGTAATGATTTTGAGCTGCAGCAGCTTTAACTCTTACCCTTTTTCCACATAGTTAT 

GGTGTTTGAGTTGGAAAGAAACAACTATAGGTAGCTACACGTACATAATTATCTCTTTAT 

TCACAAAGGGTATAGTAAAATTGATTGTAAATAACTTTCTAAGTGCCAATATTCAAAACT 

TTTGGATTAAAATGTATTTTTCACCGTGCATTTACTTTGGATGTATTTATTTCATTTAAA 

CAATTTAAATGGGGCTCTTTAACCAAAA ATGGTATTTAAAACCAAAACAGTATCGTACTT 

AGAATTTGGAGTAGAGGCCGGGCACAGTGGCTCACGCCTGTAATCCCAGCACTTTGGAAG 

GCTGAGGCAGGCGGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGTCAACATGAAAC 

CCCGTCTCTACTAAAAATACAAAAATTAGCTGGGCGTGGTGGCGTGCGCCTATAATCCCA 

GCTAGTCTACTCGGGAGGCTGAGGCAGGAGAATCGCTGGAACTCAGGAGGCAGAGACTGC 

AGTGAGCCGAGATCGCGCCACTGCACTCCAGTCTGGGTGACGGCATGACTCC ATCTCCAA 

AAAAAAAAAAAAAAGATTTTGGAGTAGATTCATCATTAATAAGTAACAGATTTTAGGAAA 

ATCAAAAAATGGCTAATAAAATGAACACAATGTAAAACATTTATTAAAATGTAGACTTTT 

AAAAATCTATAAATTGATCATCTGTTTATAAATTGGCAGATGGTTGTGTACCATCTTTTA 

AAATAAAGATTGAATTTCACCCAGTGTGATGGTTCCCATTGCTTATATTTCTCCTGCTGA 
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GGCCGGACCTGATATGGCCCTGGTCTGTGTTCCCAGCCTTGTTTCCTCATTACCACTAAA 

ATCTTTCCCCTGTATGCCCGCCCAATTTTTCTGGCTCTGAGTCCTTGTTCATACTGTTCT 

CTCCAATTCTACCTTCCAAAGGCCTTTCTTAACACCTTCGGATTCTTTCTTTGAGAACTT 

TCCAGATTCCCATGCCTTTTTGGAATCAATCTCTATCCTATTGTCATCACATTTAAGTTT 

CTACTTCCATCATCCTCACTCCTATCCCTTTGGTCCTGGGATGACAGGGATGCTGTGTTT 

TATTTACTCATCTTTGTAACTTCCACATAACCTAACCCCGGTTCTTGCTTATGGGAGATG 

CTGATTGTAGGGTCTGAGTTAGATACTGTTAACTAAAATGCTTGTTGATATTTTAGTTAT 

TAATTCATATTAACTTTGGCTGAAACTTTTAAATTCTATTGTGAATAGTCAAGTAAAATT 

TAGATTGTTACATTCTGGGTTAGTATTAGATTGTTTTTAAGATTGTTTTAAACAAGATGT 

TTTTAAGATGAGTTTTAAATAGTTCTCTTAACACAAATAAAGCTTAATATGAGTATTTGA 

AGGAAATTATCCCAAACCATTCCAGTTCCTGGCTGTGAAAGGCTTTTCCAGGCCTAATAA 

GTTTTCCACTTCAGCCGTAAGTAGGTG AAATCAAATGAACAATAGAGGGAAATGTATTTA 

TTTGCTTTATACACATGCATGTGTGTTGTGTCTACATATAAACATTGCACACGCTTAGAA 

TGAAGTTTCTGTCATGCCCAGAAAAGGGAGAGGCATTTTTGTGGATTTTGTCTGGCTGCC 

CTGGGGATGTTTGAAGAACTGTGCTGTTTACTTCATACCAGGTGTGTGAGCCATACCTTT 

GGTAGGAGGGTATAC CTC CTAC AC C CAAGAAATATAAGC CAGGAGAAGGTC TGTG C CAAG 

AGAAGGAACCCAAATGACCCACAAGAGGTGGGCCATTAATTATTGGGTCAGATGCATAAA 

TGCACAGTAATTTATTTAAGCACCTCTTAATGGTGACCCACAAGGAAGATTGCTCGTAGT 

AGCGGAAAGGTTCACAATAAATAAGAGAAAAAAGCAGAATGTAGAACTGTATGATAGCAA 

TTCTGCAAACAAGAAGCATCTTTTATAAAAGATGGAAGGAGCCCAGGCACAGTAGCTCAT 

GCCTGTAATCCCAGCACTTTAAGAGGCTGAGGTGGAGGATCACTTGAGCTGCAGTGACCC 

ATGATTGTGCCACCACTCCAGCCTGGGTGATAGAAGTGAGACCTTCTCTCAAAAAAAAAA 

AAAAAAAAAAAAAGACGGAAATTCCTCCAGAATTTTAACATGTCAACAGAGGTTTTCTGC 

AGCTACTTTTTTCAGCTTTATACTTCGCAGTATTTTCCAAATTTTCTCTAACAAGCAGTA 

TTTTCCAAATTTTTTACAATAAGCACACACACACACACACGTTTGTTTGCATAAGTGCCC 

AACTGGTGGTGAACAACCGCTGGCTTTTAGTCTATACATATCTAGAATATTTTATAAATA 

GTAGTTCTTAAACCCTTGAAAGGGAGTGAATGACCAGCTGAGAAAATAAAGTCAGTGATT 

TCATTATTTTCCTATATTCACATCATGATTCTAGGAAAGAACTTGGGAGTGACTTCCTTC 

AGCTTCAGCCACTCCTGGGCCAGGCGCATGCTTAGCTCTGTGGTAAAGGTCACCAGCTTC 

TTCTGCAGGGTGCCTGTATCATCTGAATTGGAGGTTTGGCGAGGGTAAGAGACTGATGTA 

GGTTCAAGTTTTTCTTTCCTGTCCTCCACTTGAAATCTGTCTTCCCTTCCAGACTGCCTG 

CGCTGCTGACTTAAGGCCCCAACACCAAACACAGAAGCAACAGCCTTACACAGAGTGTTC 

AGCAAGCTCCAACAATTGTGTAAGGTAAAGTTTCCTTTATAGATTCCTTTTCTATATCGC 

TCCTAGTGGTTCTGTTTCTCTGATCGAATTCTGGCTGATAACAGTTGCTGAGACTCTGAA 

AGAGAAGGCAAGGAACTACTGTTTCTCATTATAAACTGTTTAGAATTATTTGGCCATCTT 

TTTGCTATGAATATGTAGTGCTTTGATACATTTTTTAAATCAAAAAGTAATGAAAGAGAT 

CACATAGGGAAAGATAGATTGGATTATTTTTAAAGTTTATATACTAAATTGAAAAGCAAA 

GAATAAAATGGGAGAAACAGCTCCCTCATGTGGCTGTTGGCAGGAAGCTTCCATTCCTCT 

CTGTGGGCCTCCACAGGTTTGCTCACAGCAAATGGTCCGTGACAGAAAGACGCAAGGGCA 

GTTGCAC CCAAGATGGAAGC C AC CATCTTTTCT ATAAC CTAATCTG AAAGAAGGGACATA 

CCAGCACTTCTGCCATATGCTGTTGGGTCACACAGACCAACTCTGGTACAGTGTGAACAC 

AGGACCACACAAGGGCGTGAATTCCAAGGGCAGAGACCACTAGGGACCACCTCAGAGGCA 

CAGAGGGACACCCTATCCAGCTGGTGGCCAATGTAAATTAACATAGCTTTTTAGAATAGC 

AATATGTATCTATAATCTTAAAAGTATTAAAAGTACTTCTTGATCCAGTAATTTCATTTC 

TAAGAATC CATG CTAAGAGG ATTTAAAATGTGGAC CAAAAAATGGGTATAAAAAGAAGTT 

GTTAACAGTATTTAAAGTTGTGAAAAACCAGAAACAATCTAAAGGTCCAACAATAGGAAA 

ATGAATTTTGATATTTTTCTAATAGAATTTTATGCTGTCATCAGAAATACCATTTACAAA 

TAATTTTTAATAACGCAAAAAAAAGTTTATAAAATGTTTAGTGTAAAACCTGGACACAAC 

TACATAATGATTCTGATTTTGTAAAAAAAAAAAACAAAAACACACACATATACACATGCA 

TACATATGCATATAAAGAAAACTGGAACAAACAAAATAACAAGCATAGTTGGAATTACAG 

TCATTTTAATATTCTTTATGCTTTTAAAAATTTTGAAGTTTGTATTACTAGCATCCACTA 

CTTACGTAGTCAGGAAAAAAATACAACTTTAAAATAGATATTTAGGTCCAAAGATGGTAA 
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TCTAAATGGTGTTACAGGCTGAATGTGTGCCTGATCCCCATGCCCCAAGTTCATATGTTA 

AAGCCCTGGCCCCCAAGGCAATGGTATTAGGGGAGTAGGGCCTTTGGGAGGTAATCAGAT 

TTCTACGAGGTCATGAGGGTGGAGCCCGCATAGTGGAATTAGTGTCCTTTTAGGAAGAGG 

AGAACAGACCAAAGCCTTCCTTTCTCTCCTCACTATGTAAGAAGACAGCCAGAAGGTGGC 

CACAGCCAGGAAGAGAGCTCTCACCAGAACCCAAATCTGCTAGCACCTTGCTCTTGGGTT 

CTCAGCATCCAGAACTGTGAGAAATGAATGTGTGTTGTTTAAACCACTCAGGCTACGGTA 

TTTTGTTGCAG CAGC C CAAG CTGACAGAGAT AGAAACAACACAAGGACC CATCAG CAGAC 

GAATGGATGATCAAAACGTGGTGAGGTCGTGCAGTGGGATATTATTCAGCCGTAGAAGGA 

ATGAAATTCTGATACATGCTATAATGATGAACCTTGAAAACATGTTAATGGAAATAAGCC 

AAACTTAAAAGGACAAATATTGTATAATTCCACTTATATGAGTTAGTTACCTAGAATAGG 

CAAATTATGTCATAGATACAGAACATTAGAGGTTACCAGGGTTGTGGGAAGAGGGGTATT 

GTGGGTACAAATTTTCGGTTTGGAGTGATTTTGAAAAAATTCTGGAAATGGGTAGTGACA 

GTAGTCAACATGATGAATGTACTTAATGACACTAAATTGTACACTTAAAAATGGTTAATA 

CTGGGCTGGCGCAGTGGCTCATGGCTGTAAATCCCAGAACTTTGGGAGGCCAAGACAGGC 

GGATCATGAGGTCAGGAGATTGAGACCATTCTGGCTAACATGGTGAAACCCTGTCTCTAC 

TAAAAAATAAAAACAAATAAAAAAAAAATTAGCCGGGCATGGTGGCAGGCACCTGTAGTC 

CCAGCTACTCGGGAGGCTGAGGCAGGAGAATGGTGTGACCTGGGAGTCGGAGCTTGCAGT 

GAGCTGAGATCGCGCCACTGCACTCCAGCCTGGGCAACAGAGCCAGATTCCGTCTCAAAA 

AAAAAAAAAAAAAGGTTGATACCTGGGTGCGGTGGCTCATGCCTGTAATTTCAGCACTTT 

GGGAGGCCAAGGCAGGCAGATCAGTTGAGGTCAAGAGTTAAGGACCAGCCTGGCCAACGT 

GGCGAAACCCCATCTCTATTAAAAATACAAAAATTAGTCGAGTGTGGTGGTGGGTGCCTG 

TAGTCCCAGCTGCTGGGAGGATGAGGCCTAGGAATTGCTTGAACCCAGGAGGCAGAGGTT 

GCAGTGAGTTGAGATTGCGCCACTGCACTCCAGCCTGGGGGACAGAGCGAGACTTAGTCT 

CAAAAAAAAGGTTAAAATTGTAAGTTTTGTTATGCATATTTTACCATAATCTTTAAAAAA 

TAGATATATAGGAGATAAAGTCAACAGAATTTAATAACCAGTTGTAAATAGAGACTGAGT 

GAGGAGGATGAATTAAGGAAGACATTGAGT ACAACT TTTTGGTAGGTGAAAAAC TC TTAA 

AAAAATACGTGGGCAAAGATCCTACTTGATTCTTATAATTTAAAAATCTCCCAGTTAGTA 

AACAAGGCTAGGTGGAGATTTGCATGTGATGTGAGGTGTGTGTTCTGTTTTGTAATGTGA 

GGACTGTGAGCCATCTCCTGGACTTGAATATCCATTAGATAATTGAAAATACGGATTTGA 

GAACTCAGGAGACGTGCAATGCAGTAACAAAACTCTGCACCTAGTTGATTTCTGTCTCCT 

AATTTAATGCTTTTATGGGACAAACTGTTAGGCAGGTGGGCAAGATGGACAGCCATATTT 

TTGTGGGTTTCTGGCCTGTGGGCCAGCCTCAGTGCTCACTCTGAGGTCATGTCCAAACTT 

AGAACACATTCAGGCCTACCACAGTCAAGGCTCCCTTTCTCAACTCTAGTCCTCTGCACA 

AATATCCGAAGCCTAGAAATAATAATCATCTGTCCTTGTGTCTTGCATTATGAAAGCCTA 

GGAAAGGGCCTTGGGAATTAAGAAGAATGGAAAAACTGGTCTAACTGCTGCATGCTTCAG 

CTTGCAGGGGAATCACTGAAATGGGG ACAGG C CATAAAAGGACAAC CAGAAG AGTGGCTT 

CAGCAAAGGCATCGTTTTTCAGAGCAAGCTAGAGAATCCTGCCAGCGTCCTCAGGCAGGG 

CCCCTGGGCACAGAGGTTAGGCAAGGGAGTGTCCCAGCATGTTGATGCCCTGAGCATCAG 

AATAATGCCATAGAGGAGCTTCCAAAGAGTTCATTTCAGGTTTTGTAAGCCGAACATTTC 

TAGGCAAATAAAATTTGATTTTGTGAATAAAGCTTGTTTCTTCAACTCCAGTGCAGATTC 

TCATAGATTGATAGTGGCTTGTGATCCAGATAAAGAAAACAATTTTTCAAAGATTCATAT 

TCTTTGTAGATGTACGGATTT AGAGAC CATCTAATCTAACTC C CTCATTCTACAGATAGG 

AAAAATG AGGCCTAAAGAAGTTAAGAAAATACCATGGAAATGTCAC TG CTGAACTG C CAT 

ACGTAGGATCCGAAAGAAATTGGGTAAATGCTACTGTGAGAAATACAGTACTAGGTCCAA 

AGAATCT AATACAAATTAAAAATCTAAATGTTATTTCTAAAGCATC C CTGCACATGGCTG 

AACTTACATAGTTTCATTTTCTTTCTTTTCTGTTGAAGAAGAGGCAATTGGCTGGGTGCA 

GTGGCTCATGCCTGTAATCCTGGCACTTTGAGAGGCCGAGGCGGGTGGATCACCTGAGGT 

CAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATACAAA 

AATTAGCTGGCTGTGGTGGCCGCTGCCTGTAATCCCAGCTACTCCAGAGGCTGAGGCAGG 

AGAATTACTTGAATCTGGGAGGTGGAGGTTGCAGTGAGCCAAGATCACGCCATTGCACTC 

TAGCCTGGATGACAAGAGGGAAACTC CAT CTCAAAAAAAAAAAGAAAAAAAG CAATC ACT 

AACCTGTGTTGTTTATTAAACATGACAGACTGGCATGAAGTAATTACCAAACTGTAAACA 
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AAAAAGCTACAATCTGCCAGGCATGGTGGCTCATGCCTGTAATCCCCCACCTTGGGAGGC 
CAGGTTGGGGGATCACCTGAGGCCTGGAGTTCAAGACTAGCCTGGTCAACATGGTGAAAC 
CTCGTCTCTACTAAAAATACAAAAATTAGCCCGGCGTGGTGGCACATCCCTGTAATCCCA 
GTTACTCAGGAGGCTGAGGCAGGAGAATCACTTGAACCTGGGCAGTGGGGAGGTTGCAGT 
GAGCCAAGATCGCACCGTTGTACTCCAGTCTGGGCCGACAGAGTGAGACTCGGTCTCAAA 
AAAAAGAAAAAAGAAAAGCTACAACCTTAATCTCAACTTCTCATAACATCATCTCTACTT 
CTGATTAGAAGAGTGGAAGTGGGGAGGTTTATTACAAAAAGACTGTTATACCTTACACAC 
TTCTCCCCATGAATAGTGAAGGTGTGAGTGAAAAAGACAGCAATTTTATTTTTTTTTTGA 
AACAGGTTCTTGCACTGTCACCCGGGCTGGAGTGCACTGTTGTGATCACTGCTCACTGCA 
GCCTCCACCTCCCAGGCTCAAGTGATC.CTCCTACCTCAGCCTCCTGAGTAGCTGGGACCA 
CAGTTGTGCACTACCATGCCCAGCTATTTTTTTTTAAGAGATGGGGTCTCACTATATTGC 
TTAGGCTAGTTCTCAAACTCCTGGCCTCAAGCAGTCCTCCGACCTTGGCCTCCCAAAGGG 
TTGTGATTACAGGCATAAGCCACCACACCCAGCCAGCAGTTTTAGAATAAAGGGTGAAGG 
TGCTGTTGGGGAAATATAATTTAAAAAACAAAATCTTCTCTCAACCCAGAAATCCTCTCC 
ATGAAG GCAGTAGAGAAAGATAAGCTTTATTATTGAATAAAAATTAAATGAGAATGTGAT 
GCACATCACAGGCACTTTGCTAAGAGATCACAAAGACAGAAGGAAATTTCACCATTTTGT 
ACAGCCAAGCAGGTACAGCCCATTACATGTATGTTTTCGAGATAAATAGTCCTCAACTAA 
GAGAACTTGACAGCACCACTGGTCACACAGTTCATTCTAACTTTACCTGATAATTGATGT 
GACCACTTGTGTTATCTAAGATATCAACTTTTCGGGGGTGGGGGAGTGTGGAAACAGGAG 
TTACTTTTATAGCTTGGTGCAAGGTACTCATTAAGATTAGGCTGTTACCCTCCCACAGAA 
ACTGGAAGATAGGTATGCTATCTGGTAATGTTTACATTTCCCAGATCCTTGAGAAAGACA 
TTCCTAGGTCATAAAGCTGACAAAAGGCTGATTCAGTTTTTAAATATATATATCTGTATA 
TGTATTTCA 
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actgagagacaggactagctggatttcctaggctgactaagaatccctaagcctagctgg 

MIMIIIIillllMIIIIIIIMIi: III! IIIIIIIMI MMIIIIIIIIIII 

actgagagacaggactagctggatttcccaggccgactaagaattcctaagcctagctgg 
g-aaggtgaccacatccacctttaaacacggggcttgcaacttagctcacacctgaccaa 

I llllllllllll II lllllllllll I Mill III! MINIUM llllll 

ggaaggtgaccacaccctcctttaaacacagagcttgtaactcagctcacacccgaccaa 
tcag agagctcactaaaatgctaattaggc-aaagacaggaggtaaagaaa 

MM IMIIIIIIIMIII I IIMIIII.III MIMMMMIMM 

tcaggtagtaaagagagctcactaaaataccaattaggctaaaaacaggaggtaaagaaa 
tagccaa-tcatctattgcctgagagcacagcaggagggacaatgatcgggatataaacc 

II II! llllllll MMMIMIMM Illllllllllllllllllllllllll 

taatcaaatcatctatcgcctgagagcacagggggagggacaatgatcgggatataaacc 
caagtcttcgagccggcaacggcaaccccctttgggtcccctccctttgtatgggagctc 

II I II Mill I II Mill MMMIMIMM I lllllllllllll 

caggcatttgagccagatcaggtaaccctctttgggtcccctcacactgtatgggagctc 
tgttttcatgctatttcactctattaaatcttgcaactgcac--tcttctggtccatgtt 

MM IIIMIIIIIIIIIIIIIIIIIIIIII! MMMIMMIMM 

tgtt ttcactctattaaatcttgcaactgcacactcttctggtccatgtt 

tcttacggcttgagctgagctttcgctcgccatccaccactgctgtttgccgccaccgca 

I II Mill MIMMIMI Mlllll MIMMMMM llllllll III 

tgttccggctcaagctgagcttttgctcgccgtccaccactgctgaatgccgccattgca 
gacccgccgctgactcccatccctctggatcatgcagggtgtccgctgtgctcctgatcc 

MM III Mill III Mill Mill MM IIIIIIIMI IMIMIMI 

gacctgcccttgacttccacccctccggatccggcagagtgtccgctgcactcccgatcc 
agcgaggcacccattgccgctcccaatcgggctaaaggcttgccattgttcctgcatggc 

MMIIMIIIIIIIMI Mill III MIMIMMMMIMMMMMM II 

agcgaggcacccattgccactcccgatcaggctaaaggcttgccattgttcctgcacagc 
taagtgcctgggttcatcctaattgagctgaacactagtcactgggttccatggttctct 

MMMIIIII 1 1 III I Ml II I IIMIIMM III IIIIIIIMI IIMIMI 

taagtgcctgggttcatcctaatcaggctgaacactggtcgctgggttccacggttctct 
tctgtgacccacagcttctaatagagctataacactcaccgcatggcccaaggttccatt 

II MM II MIM I Ml Mill Ml II Mill II III II 1 1 1 1 1 1 1 II II 1 1 1 II I 

tccatgactcacagcttctaatagagctataacactcaccacatggcccaaggttccatt 
cctt-gaatccataaggccaagaaccccaggtcagagaacacgaggcttgccaccatctt 

I II IIMIMI II MM IIMMIMI Mlllilll I MM III MINI 

cgttggaatccatgaggccaagaaccccaggtcagagaataaaaggcccgcc-ccatctt 
gggag 

Mill 
gggag 
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TCCTGTGAAC CTCTAGAGGA TTTGCGCCTG CTCTTCAAAC AACAACCAGG AGGAAAGTAA 7 8 60 

CTAAAATCAT AAATCCCCAT GGCCCTCCCT TATCATATTT TTCTC7TTAC TGTTCTTTTA 7 920 

CCCTCTTTCA CTCTCACTGC ACCCCCTCCA TGCCGCTGTA TGACCAGTAG CTCCCCTTAC 7 930 

CAAGAGTTTC TATGGAGAAT GCAGCGTCCC GGAAATATTG ATGCCCCATC GTATAGGAGT 3 04 0 

CTTTCTAAGG GAACCCCCAC CTTCACTGCC CACACCCATA TGCCCCGCAA CTGCTATCAC 8100 

TCTGCCACTC TTTGCATGCA TGCAAATACT CATTATTGGA CAGGAAAAAT GATTAATCCT 8160 

AGTTGTCCTG GAGGACTTGG AGTCACTGTC TGTTGGACTT ACTTCACCCA AACTGGTATG 8220 

TCTGATGGGG GTGGAGTTCA AGATCAGGCA AGAGAAAAAC ATGTAAAAGA AGTAATCTCC 8 2 SO 

CAACTCACCC GGGTACATGG CACCTCTAGC CCCTACAAAG GACTAGATCT CTCAAAACTA 834 0 

CAT G AAAC C C TCCGTACCCA TACTCGCCTG GTAAGCCTAT TTAATACCAC CCTCACTGGG 8 4 00 

CTCCATGAGG TCTCGGCCCA AAACCCTACT AACTGTTGGA TATGCCTCCC CCTGAACTTC 8 4 60 

AGGCCATATG TTTCAATCCC TGTACCTGAA CAATGGAACA ACTTCAGCAC AGAAATAAAC 852 0 

ACCACTTCCG TTTTAGTAGG ACCTCTTGTT TCCAATCTGG AAATAACCCA TACCTCAAAC 858 0 

CTCACCTGTG TAAAATTTAG CAATACTACA TACACAACCA ACTCCCAATG CATCAGGTGG 8 64 0 

GTAACTCCTC CCACACAAAT AGTCTGCCTA CCCTCAGGAA TATTTTTTGT CTGTGGTACC 87 00 

TCAGCCTATC GTTGTTTGAA TGGCTCTTCA GAATCTATGT GCTTCCTCTC ATTCTTAGTG 87 50 

CCCCCTATGA CCATCTACAC TGAACAAGAT TTATACAGTT ATGTCATATC TAAGCCCCGC 8 820 

AACAAAAGAG TACCCATTCT TCCTTTTGTT ATAGGAGCAG GAGTGCTAGG TGCACTAGGT 8880 

ACTGGCATTG GCGGTATCAC AACCTCTACT CAGTTCTACT ACAAACTATC TCAAGAACTA 8 94 0 

AATGGGGACA TGGAACGGGT CGCCGACTCC CTGGTCACCT TGCAAGATCA ACTTAACTCC 9000 

CTAGCAGCAG TAGTCCTTCA AAATCGAAGA GCTTTAGACT TGCTAACCGC TGAAAGAGGG 9060 

GGAACCTGTT TATTTTTAGG GGAAGAATGC TGTTATTATG TTAATCAATC CGGAATCGTC 912 0 

ACTGAGAAAG TTAAAGAAAT TCGAGATCGA ATACAACGTA GAGCAGAGGA GCTTCGAAAC 9180 

ACTGGACCCT GGGGCCTCCT CAGCCAATGG ATGCCCTGGA TTCTCCCCTT CTTAGGACCT 92 4 0 

CTAGCAGCTA TAATATTGCT ACTCCTCTTT GGACCCTGTA TCTTTAACCT CCTTGTTAAC 93 00 

TTTGTCTCTT CCAGAAT CGA AGCTGTAAAA CTACAAATGG AGCCCAAGAT GCAGTCCAAG 93 60 

ACTAAGATCT ACCGCAGACC CCTGGACCGG CCTGCTAGCC CACGATCTGA TGTTAATGAC 9420 

ATCAAAGGCA CCCCTCCTGA GGAAATCTCA GCTGCACAAC CTCTACTACG CCCCAATTCA 94 8 0 

GCAG GAAGC A GTTAGAGCGG TCTCGGCCAA CCTCCCCAAC AGCACTTAGG TTTTCCTGTT 95 4 0 
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AAGCTCCTTCAGGAGAACAAAGAACAGGCCATTACCCTGGAGAAGACTGGCAACTGATTTTACCCACAAGCCCAA 
LysLeuLeuGlnGluAsnLysGluGlnAlalleThrLeuGluLysThrGlyAsn. . . PheTyrProGlnAlaGln 
SerSerPheArgArgThrLysAsnArgProLeuProTrpArgArgLeuAlaThrAspPheThrHisLysProLys 
AlaProSerGlyGluGlnArgThrGlyHisTyrProGlyGluAspTrpGlnLeuIleLeuProThrSerProAsn 

ACCTCAGGGATTTCAGTATCTACTAGTCTGGGTAGATACTTTCACGGGTTGGGCAGAGGCCTTCCCCTGTAGGAC 
ThrSerGlylleSerValSerThrSerLeuGlyArgTyrPheHisGlyLeuGlyArgGlyLeuProLeu . . . Asp 
ProGlnGlyPheGlnTyrLeuLeuValTrpValAspThrPheThrGlyTrpAlaGliLAlaPheProCysArgThr 
LeuArgAspPheSerlleTyr . . .SerGly. . . IleLeuSerArgValGlyGlnArgProSerProValGlyGln 

AGAAAAGGCCCAAGAGGTAATAAAGGCACTAGTTCATGAAATAATTCCCAGATTCGGACTTCCCCGAGGCTTACA 
ArgLysGlyProArgGlyAsnLysGlyThrSerSer . . . AsnAsnSerGlnlleArgThrSerProArgLeuThr 
GluLysAlaGlnGluVallleLysAlaLeuValHisGluIlelleProArgPheGlyLeuProArgGlyLeuGln 
LysArgProLysArg ArgHis . . . PheMETLys . . . PheProAspSerAspPheProGluAlaTyrArg 

GAGTGACAATAGCCCTGCTTTCCAGGCCACAGTAACCCAGGGAGTATCCCAGGCGTTAGGTATACGATATCACTT 
Glu. . .Gin. . . ProCysPheProGlyHisSerAsnProGlySerlleProGlyValArgTyrThrlleSerLeu 
SerAspAsnSerProAlaPheGlnAlaThrValThrGlnGlyValSerGlnAlaLeuGlylleArgTyrHisLeu 
ValThrlleAlaLeuLeuSerArgProGln . . . ProArgGluTyrProArgArg . . . ValTyrAspIleThrTyr 

ACACTGCGCCTGAAGGCCACAGTCCTCAGGGAAGGTCGAGAAAATGAATGAAACACTCAAAGGACATCTAAAAAA 
ThrLeuArgLeuLysAlaThrValLeiiArgGluGlyArgGluAsnGlu . . . AsnThrGlnArgThrSerLysLys 
HisCysAla. . . ArgProGlnSerSerGlyLysValGluLysMETAsnGluThrLeuLysGlyHisLeuLysLys 
ThrAlaProGluGlyHisSerProGlnGIyArgSerArgLys . . . METLysHisSerLysAspIle . . . LysSer 

GCAAACCCAGGAAACCCACCTCACATGGCCTGCTCTGTTGCCTATAGCCTTAAAAAGAATCTGCAACTTTCCCCA 

385 395 405 415 425 435 445 

AlaAsnProGlyAsnProProHisMETAlaCysSerValAlaTyrSerLeuLysLysAsnLeuGlnLeuSerPro 
GlnThrGlnGluThrHisLieuThrTrpProAlaLeuLeuProIleAlaLeuLysArglleCysAsnPheProGln 
LysProArgLysProThrSerHisGlyLeuLeuCysCysLeu. . .Pro. . . LysGluSerAlaThrPheProLys 

AAAAGCAGGACTTAGCCCATACGAAATGCTGTATGGAAGGCCCTTCATAACCAATGACCTTGTGCTTGACCCAAG 
LysSerArgThr . . . ProIleArgAsnAlaValTrpLysAlaLeuHisAsnGln . . .ProCysAla. . . ProLys 
LysAlaGlyLeuSerProTyrGluMETLeuTyrGlyArgProPhelleThrAsnAspLeuValLeuAspProArg 
IiysGlnAspLeuAlaHisThrLysCysCysMETGluGlyProSer . . . ProMETThrLeuCysLeuThrGlnAsp 

ACAGCCAACTT AGTTGC AGAC AT C ACCT CCTTAG CCAAATATCAAC AAGTT CTTAAAACATTACAAGGAAC CTAT 
ThrAlaAsnLeuValAlaAspIleThrSerLeuAlaLysTyrGlnGlnValLeuLysThrLeuGlnGlyThrTyr 
GlnProThr. . . LeuGlnThrSerProPro . . . ProAsnlleAsnLysPheLeuLysHisTyrLysGluProIle 
SerGlrLLeuSerCysArgHisHisLeuLeuSerGlnlleSerThrSerSer . . . AsnlleThrArgAsnLeuSer 

CCCTGAGAAGAGGGAAAAGAACTATTCCACCCTTGTGACATGGTATTAGTCAAGTCCCTTCCCTCTAATTCCCCA 
Pro . . . GluGluGlyLysGluLeuPheHisProCysAspMETValLeuValLysSerLeuProSerAsnSerPro 
ProGluLysArgGluLysAsnTyrSerThrLeuValThrTrpTyr . . . SerSerProPheProLeuIleProHis 
LeuArgArgGlyLysArgThrlleProProLeu. . . HisGlylleSerGlnValProSerLeu . . , PheProIle 

TCCCTAGATACATCCTGGGAAGGACCCTACCCAGTCATTTTATCTACCCCAACTGCGGTTAAAGTGGCTGGAGTG 
SerLeviAspThrSerTrpGluGlyProTyrProVallleLeuSerThrProThrAlaValLysValAlaGlyVal 
Pro. . , IleHisProGlyLysAspProThrGlnSerPheTyrLeuProGlnLeuArgLeuLysTrpLeuGluTrp 
ProArgTyrlleLeuGlyArgThrLeuProSerHisPhelleTyrProAsnCysGly . . . SerGlyTrpSerGly 
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GAGTCTTGGATACATCACACTTGAGTCAAATCCTGGATACTGCCAAAGGAACCTGAAAATCCAGGAGACAACGCT 
GluSerTrpIleHisHisThr . . . ValLysSerTrpIleLeuProLysGluProGluAsnProGlyAspAsnAla 
SerLeuGlyTyrlleThrLeuGluSerAsnProGlyTyrCysGlnArgAsnLeuLysIleGlnGluThrThrLeu 
ValLexoAspThrSerHisLeuSerGlnlleLeuAspThrAlaLysGlyThr . . . LysSerArgArgGlnArg . . . 

AGCTATTCCTGTGAACCTCTAGAGGATTTGCGCCTGCTCTTCAAACAACAACCAGGAGGAAAGTAACTAAAATCA 
SerTyrSerCysGluProLeuGluAspLeuArgLeuLeuPheLysGlnGlnProGlyGlyLys . . . LeuLysSer 
AlalleProValAsnLeu. . . ArglleCysAlaCysSerSerAsnAsnAsnGlnGluGluSerAsn . . .AsnHis 
LeuPheLeu, . . ThrSerArgGlyPheAlaProAlaLeuGlnThrThrThrArgArgLysValThrLysIlelle 

TAAATCCCCATGGCCCTCCCTTATCATATTTTTCTCTTTACTGTTCTTTTACCCTCTTTCACTCTCACTGCACCC 
. . . ileProMETAlaLeuProTyrHisIlePheLeuPheThrValLeuLeuProSerPheThrLeuThrAlaPro 
LysSerProTrpProSerLeuIlellePhePheSerLeuLeuPhePheTyrProLeuSerLeuSerLeuHisPro 
AsnProHisGlyProProLeuSerTyrPheSerLeuTyrCysSerPheThrLeuPheHisSerHisCysThrPro 

CCTCCATGCCGCTGTATGACCAGTAGCTCCCCTTACCAAGAGTTTCTATGGAGAATGCAGCGTCCCGGAAATATT 
ProProCvsArcrCvsMETThrSerSerSerProTvrGlnGluPheLeuTr-pArqMETGlnArq-ProGlvAsnlle 
LeuHisAlaAlaVal . . . ProValAlaProLeuThrLysSerPheTyrGlyGluCysSerValProGluIleLeu 
SerMETProLeuTyrAspGln. . . LeuProLeuProArgValSerMETGluAsnAlaAlaSerArgLysTyr . . . 

GATGCCCCATCGTATAGGAGTCTTTCTAAGGGAACCCCCACCTTCACTGCCCACACCCATATGCCCCGCAACTGC 
AspAlaProSerTvrArgSerLeuSerLvsGlvThrProThrPheThrAlaHisThrHisMETProArcrAsnCvs 
METProHisArglleGlyValPheLeuArgGluProProProSerLeuProThrProIleCysProAlaThrAla 
CysProIleVal . . .GluSerPhe. . . GlyAsnProHisLeuHisCysProHisProTyrAlaProGlnLeuLeu 

TATCACTCTGCCACTCTTTGCATGCATGCAAATACTCATTATTGGACAGGAAAAATGATTAATCCTAGTTGTCCT 
TvrHisSerAlaThrLeuCvsMETHisAlaAsnThrHisTvrTrpThrGlyLvsMETIieAsriProSerCvsPro 
IleThrLeuProLeuPheAlaCysMETGlnlleLeuIlelleGlyGlnGluLys . . . LeuIleLeuValValLeu 
SerLeuCysHisSerLeuHisAlaCysLysTyrSerLeuLeuAspArgLysAsnAsp . . . Ser. . .LeuSerTrp 

GGAGGACTTGGAGTCACTGTCTGTTGGACTTACTTCACCCAAACTGGTATGTCTGATGGGGGTGGAGTTCAAGAT 
GIvGlvLeuGlvValThrValCvsTrpThrTyrPheThrGlnThrGlvMETSerAspGlvGlvGlvValGlnAsp 
GluAspLeuGluSerLeuSerValGlyLeuThrSerProLysLeuValCysLeuMETGlyValGluPheLysIle 
ArgThrTrpSerHisCysLeuLeuAspLeuLeuHisProAsnTrpTyrVal . . . TrpGlyTrpSerSerArgSer 

CAGGCAAGAGAAAAACATGTAAAAGAAGTAATCTCCCAACTCACCCGGGTACATGGCACCTCTAGCCCCTACAAA 
GlnAlaArgGluIiVsHisValLvsGluVallleSerGlnLeuThrArqValHisGlvThrSerSerProTvrLys 
ArgGlnGluLysAsnMET . . . LysLys . . . SerProAsnSerProGlyTyrMETAlaProLeuAlaProThrLys 
GlyLysArgLysThrCysLysArgSerAsnLeuProThrHisProGlyThrTrpHisLeu . . . ProLeuGlnArg 

GGACTAGATCTCTCAAAACTACATGAAACCCTCCGTACCCATACTCGCCTGGTAAGCCTATTTAATACCACCCTC 
GlvLeuAspLeuSerLvsLeuHisGluThrLeuArgThrHisThrArqLeuValSerLeuPheAsnThrThrLeu 
Asp. . . IleSerGlnAsnTyrMETLysProSerValProIleLeuAlaTrp . . . AlaTyrLeuIleProProSer 
ThrArgSerLeuLysThrThr . . . AsnProProTyrProTyrSerProGlyLysProIle . . . TyrHisProHis 

ACTGGGCTCCATGAGGTCTCGGCCCAAAACCCTACTAACTGTTGGATATGCCTCCCCCTGAACTTCAGGCCATAT 
ThrGlvLeiiHisGluValSerAlaGlnAsnProThrAsnCvsTrpIleCysLeuProLeuAsnPheArgProTyr 
LeuGlySerMETArgSerArgProLysThrLeuLeuThrValGlyTyrAlaSerPro . . . ThrSerGlyHisMET 
TrpAlaPro. . . GlyLeuGlyProLysProTyr . . . LeuLeuAspMETProProProGluLeuGlnAlalleCys 

GTTTCAATCCCTGTACCTGAACAATGGAACAACTTCAGCACAGAAATAAACACCACTTCCGTTTTAGTAGGACCT 
ValSerlleProValProGluGlnTrpAsnAsnPheSerThrGluIleAsnThrThrSerValLeuValGlvPro 

PheGlnSerLeuTyrLeuAsnAsnGlyThrThrSerAlaGlnLys . . . ThrProLeuProPhe AspLeu 

PheAsnProCysThr . . . ThrMETGluGlnLeuGlnHisArgAsnLysHisHisPheArgPheSerArgThrSer 
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CTTGTTTCCAATCTGGAAATAACCCATACCTCAAACCTCACCTGTGTAAAATTTAGCAATACTACATACACAACC 
LeuValSerAsnLeuGluIleThrHisThrSerAsnLeuThrCvsValLvsPheSerAsnThrT hrTvrThrThr 
LeuPheProIleTrpLys . . . ProIleProGlnThrSerProVal . . . AsnLeuAlalleLeuHisThrGlnPro 
CysPheGlnSerGlyAsnAsnProTyrLeuLysProHisLeuCysLysIle . . . GlnTyrTyrlleHisAsnGln 



AACTCCCAATGCATCAGGTGGGTAACTCCTCCCACACAAATAGTCTGCCTACCCTCAGGAATATTTTTTGTCTGT 
AsnSerGlnCvsIleArcrTrpValThrProProThrGlrilleValCvsLeuProSerGlvIlePhe PheValCvs 
ThrProAsnAlaSerGlyGly . . . LeuLeuProHisLys . . . SerAlaTyrProGlnGluTyrPheLeuSerVal 
LeuProMETHisGlnValGlyAsnSerSerHisThrAsnSerLeuProThrLeuArgAsnllePheCysLeuTrp 

GGTACCTCAGCCTATCGTTGTTTGAATGGCTCTTCAGAATCTATGTGCTTCCTCTCATTCTTAGTGCCCCCTATG 
GlvThrSerAlaTvrArcrCvsLeuAsnGlvSerSerGluSerMETCvsPheLeuSerPheLeuValProProMET 
ValProGlnProIleValVal . . . METAlaLeuGlnAsnLeuCysAlaSerSerHisSer . . .CysProLeu. . . 
TyrLeuSerLeuSerLeuPheGluTrpLeuPheArglleTyrValLeuProLeuIleLeuSerAlaProTyrAsp 



ACCATCTACACTGAACAAGATTTATACAGTTATGTCATATCTAAGCCCCGCAACAAAAGAGTACCCATTCTTCCT 
ThrIleTvrThrGluGlnAspL.euTvrSerTvrValIleSerLysProArcrAsnLvsArcTValProIleLeuPro 
ProSerThrLeiiAsnLysIleTyrThrValMETSerTyrLeuSerProAlaThrLysGluTyrProPhePheLeu 
HisLeuHis. . . ThrArgPhelleGlnLeuCysHisIle . . . AlaProGlnGlnLysSerThrHisSerSerPhe 

TTTGTTATAGGAGCAGGAGTGCTAGGTGCACTAGGTACTGGCATTGGCGGTATCACAACCTCTACTCAGTTCTAC 
PheVallleGlvAlaGIvValLeuGlvAlaLeuGlvThrGlvIleGlvGlylleThrThrSerThrGlnPheTvr 
LeuLeu. . . GluGlnGluCys . . .ValHis. . . ValLeuAlaLeuAlaValSerGlnProLeuLeuSerSerThr 
CysTyrArgSerArgSerAlaArgCysThrArgTyrTrpHisTrpArgTyrHisAsnLeuTyrSerValLeuLeu 

TACAAACTATCTCAAGAACTAAATGGGGACATGGAACGGGTCGCCGACTCCCTGGTCACCTTGCAAGATCAACTT 
TvrLvsLeuSerGlnGluLetiAsnGlvAspMETGlxjiArcrValAlaAspSerLeuValThrLeuGlnAspGlnLeu 
ThrAsnTyrLeuLysAsn . . . METGlyThrTrpAsnGlySerProThrProTrpSerProCysLysIleAsnLeu 
GlnThrlleSerArgThrLysTrpGlyHisGlyThrGlyArgArgLeuProGlyHisLeuAlaArgSerThr . . . 

AACTCCCTAGCAGCAGTAGTCCTTCAAAATCGAAGAGCTTTAGACTTGCTAACCGCTGAAAGAGGGGGAACCTGT 
AsnSerLeuAlaAlaValValLeuGlnAsnArQArcrAlaLeiiAspLeuIjeuThrAlaGluAraGlvGlvThrCvs 
ThrPro. . .GlnGln. . . SerPheLysIleGluGluLeu . . . ThrCys . . . ProLeuLysGluGlyGluProVal 
LeuProSerSerSerSerProSerLysSerLysSerPheArgLeuAlaAsnArg . . . LysArgGlyAsnLeuPhe 

TTATTTTTAGGGGAAGAATGCTGTTATTATGTTAATCAATCCGGAATCGTCACTGAGAAAGTTAAAGAAATTCGA 
LeuPheLeuGlvGluGluCysCvsTyrTyrValAsnGlnSerGlvIleValThrGluLvsValLvsGluIieArg 
TyrPhe . . . GlyLysAsnAlaVallleMETLeuIleAsnProGluSerSerLeuArgLysLeuLysLysPheGlu 
IlePheArgGlyArgMETLeuLeuLeuCys . . . SerlleArgAsnArgHis . . .GluSer. . . ArgAsnSerArg 

GATCGAATACAACGTAGAGCAGAGGAGCTTCGAAACACTGGACCCTGGGGCCTCCTCAGCCAATGGATGCCCTGG 
AspArcrIleGlnAraArc?AlaGluGiuLeuArQAsnThrGlyProTrpGlyLeuLeuSerGlnTrpMETProTrp 
IleGluTyrAsnValGluGlnArgSerPheGluThrLeuAspProGlyAlaSerSerAlaAsnGlyCysProGly 
SerAsnThrThr . . . SerArgGlyAlaSerLysHisTrpThrLeuGlyProProGlnProMETAspAlaLeixAsp 

ATTCTCCCCTTCTTAGGACCTCTAGCAGCTATAATATTGCTACTCCTCTTTGGACCCTGTATCTTTAACCTCCTT 
IleLeuProPheLeuGlyProIieuAlaAlallelleLeuLeuLeuLeuPheGlyProCysIlePheAsnLeuLeu 
PheSerProSer . . .AspLeu. . .GlnLeu. . . TyrCysTyrSerSerLeuAspProValSerLeuThrSerLeu 
SerProLeuLeuArgThrSerSerSerTyrAsnlleAlaThrProLeuTrpThrLeuTyrLeu . . . ProProCys 
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GTTAACTTTGTCTCTTCCAGAATCGAAGCTGTAAAACTACAAATGGAGCCCAAGATGCAGTCCAAGACTAAGATC 
ValAsnPheValSerSerArqlleGluAlaValLvsLeuGlnMETGiuProLvsMETGlnSerLvsThrLysIle 
LeuThrLeuS erLeuProGluSerLysLeu . . . AsnTyr LysTrpSer P roArgCy s S erProArgLeuArgS e r 
. . . LeuCysLeuPheGlnAsnArgSerCysLysThrThrAsnGlyAlaGlnAspAlaValGlriAsp . . . AspLeu 

TACCGCAGACCCCTGGACCGGCCTGCTAGCCCACGATCTGATGTTAATGACATCAAAGGCACCCCTCCTGAGGAA 
Tyr ArcrArgProLexxAspArcrProAlaSe rProArcrSer AspVa I AsnAsp 1 1 eLvsGl yThr Pr oProGl uGlu 
ThrAlaAspProTrpThrGlyLeuLeuAlaHisAspLeuMETLeuMETThrSerLysAlaProLeuLeuArgLys 
ProGlnThrProGlyProAlaCys . . . ProThrlle. . . Cys HisGlnArgHisProSer . - .GlyAsn 



ATCTCAGCTGCACAACCTCTACTACGCCCCAATTCAGCAGGAAGCAGTTAGAGCGGTCGTCGGCCAACCTCCCCA 
IleSerAiaAlaGinProLeuLeuArgProAsnSerAlaGlvSerSer . . . SerGlyArgArgProThrSerPro 
SerGlnLeuHisAsnLeuTyrTyrAlaProIleGlnGlnGluAlaValArgAlaValValGlyGlnProProGln 
LeuSerCysThrThrSerThrThrProGlnPheSerArgLysGlnLeuGluArgSerSerAl aAsnLeuProAsn 

ACAGCACTTAGGTTTTCCTGTTGAGATGGGGG 
ThrAlaLeuArgPheSerCys . . .AspGlyGly 
GlnHisLeuGlyPheProValGluMETGly 
SerThr. . . ValPheLeuLeuArgTrpGly 
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LysLeuLeuGlnGluAsnLysGluGlnAlalleThrLeuGluLysThrGlyAsn. . . PheTyrProGlnAiaGln 
ThrSerGlylleSerValSerThrSerLeuGlyArgTyrPheHisGlyLeuGlyArgGlyLeuProLeu . . -Asp 
ArgLysGlyProArgGlyAsnLysGIyThrSerSer . . . AsnAsnSerGlnlleArgThrSerProAr gLeuThr 
Glu. . .Gin. . . ProCysPheProGlyHisSerAsnProGlySerlleProGlyValArgTyrThrlleSerLeu 
ThrLeuArgLeuLysAlaThrValLeuArgGluGlyArgGluAsnGlu . . . AsnThrGlnArgThrSerLysLys 

AlaAsnProGlyAsnProProHisMETAlaCysSerValAlaTyrSerLeuLysLysAsnLeuGlnLeuSerPro 
LysSerArgThr . . . ProIleArgAsnAlaValTrpLysAlaLeuHisAsnGln . . . ProCysAla. . - ProLys 
ThrAlaAsnLeuValAlaAspIleThrSerLeuAIaLysTyrGlnGlnValLeuLysThrLeuGlnGIyThrTyr 
Pro. . . GluGluGlyLysGluLeuPheHisProCysAspMETValLeuValLysSerLeuProSerAsnSerPro 
SerLeuAspThrSerTrpGluGlyProTyrProValZleLeuSerThrProThrAlaValLysValAlaGIyVai 
GluSerTrpIleHisHisThr . . . ValLysSerTrpIleLeuProLysGluProGluAsnProGlyAspAsnAla 
SerTyrSerCysGluProLeuGluAspLeuArgLeuLeuPheLysGlnGlnProGlyGlyLys . . . LeuLysSer 
. . . HeProMETAlaLeuProTyrHisIlePheLeuPheThrValLeuLeuProSerPheThrLeuThrAlaPro 
ProProCysArgCysMETThrSerSerSerProTyrGlnGluPheLeuTrpArgMETGlnArgProGlyAsnlle 
AspAlaProSerTyrArgSerLeuSerLysGlyThrProThrPheThrAlaHisThrHisMETProArgAsnCys 
TyrHisSerAlaThrLeuCysMETHisAlaAsnThrHisTyrTrpThrGlyLysMETIleAsnProSerCysPro 
GlyGlyLeuGlyValThrValCysTrpThrTyrPheThrGlnThrGlyMETSerAspGlyGlyGlyValGlnAsp 
GlnAlaArgGluLysHisValLysGluVallleSerGlnLeuThrArgValHisGlyThrSerSerProTyrLys 
GlyLeuAspLeuSerLysLeuHisGluThrLeuArgThrHisThrArgLeuValSerLeuPheAsnThrThrLeu 
ThrGlyLeuHisGluValSerAlaGlnAsnProThrAsnCysTrpIleCysLeuProLeuAsnPheArgProTyr 
ValSerlleProValProGluGlnTrpAsnAsnPheSerThrGluIleAsnThrThrSerValLeuValGlyPro 
LeuValSerAsnLeuGluIleThrHisThrSerAsnLeuThrCysValLysPheSerAsnThrThrTyrThrThr 
AsnSerGlnCysIleArgTrpValThrProProThrGlnlleValCysLeuProSerGlyllePhePheValCys 
GlyThrSerAlaTyrArgCysLeuAsnGlySerSerGluSerMETCysPheLeuSerPheLeuValProProMET 
ThrlleTyrThrGluGlnAspLeuTyrSerTyrVallleSerLysProArgAsnLysArgValProIleLeuPro 
PheVallleGlyAlaGlyValLeuGlyAlaLeuGlyThrGlylleGlyGlylleThrThrSerThrGlnPheTyr 
TyrLysLeuSerGlnGluLeuAsnGlyAspMETGluArgValAlaAspSerLeuValThrLeuGlnAspGlnLeu 
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AsnSerLeuAlaAlaValValLeuGlnAsnArgArgAlaLeuAspLeuLeuThrAiaGluArgGlyGI yThrCys 
LeuPheLeuGlyGluGluCysCysTyrTyrValAsnGlnSerGlylleValThrGIuLysValLysGiuIieArg 
AspArglleGlnArgArgAlaGluGluLeuArgAsnThrGlyProTrpGIyLeuLeuSerGlnTrpMETProTrc 
IleLeuProPheLeuGlyProLeuAlaAlallelleLeuLeuLeuLeuPheGiyProCysIlePheAsnLeuLeu 
ValAsnPheValSerSerArglleGluAiaValLysLeuGlnMETGluProLysMETGlnSerLysThrLysIle 
TyrArgArgProLeuAspArgProAlaSerProArgSerAspValAsnAspIleLysGlyThrProProGIuGlu 
IleSerAlaAlaGlnProLeuLeuArgProAsnSerAlaGlySerSer . . . SerGlyArgArgProThrSer Pro 
ThrAlaLeuArgPheSerCys . . .AspGiyGly 
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SerSerPheArgArgThrLysAsnArgProLeuProTrpArgArgLeuAlaThrAspPheThrHisLysProLys 
ProGlnGlyPheGlnTyrLeuLeuValTrpValAspThrPheThrGIyTrpAlaGluAlaPheProCysArgThr 
GluLysAlaGlnGluVallleLysAlaLeuValHisGluIlelleProArgPheGlyLeuProArgGlyLeuGln 
SerAspAsnSerProAlaPheGlnAlaThrValThrGlnGlyValSerGlnAlaLeuGlylleArgTyrHisLeu 
HisCysAla . . . ArgProGlnSerSerGiyLysValGluLysMETAsnGluThrLeuLysGlyHisLeuLysLys 
GlnThrGlnGluThrHisLeuThrTrpProAlaLeuLeuProIleAlaLeuLysArglleCysAsnPheProGlr. 
LysAlaGlyLeuSerProTyrGluMETLeuTyrGlyArgProPhelleThrAsnAspLeuValLeuAspProArc 
GlnProThr. . . LeuGlnThrSerProPro . . . ProAsnlleAsnLysPheLeuLysHisTyrLysGluProIle 
ProGluLysArgGluLysAsnTyrSerThrLeuValThrTrpTyr . . . SerSerProPheProLeuIleProHis 
Pro . . . IleHisProGlyLysAspProThrGlnSerPheTyrLeuProGlnLeuArgLeuLysTrpLeuGluTrp 
SerLeuGlyTyrlleThrLeuGluSerAsnProGlyTyrCysGlnArgAsnLeuLysIleGlnGluThrThrLeu 
AlalleProValAsnLeu. . . ArglleCysAlaCysSerSerAsnAsnAsnGlnGluGluSerAsn . . .AsnHis 
LysSerProTrpProSerLeuIlellePhePheSerLeuLeuPhePheTyrProLeuSerLeuSerLeuHisPro 
LeuHisAlaAIaVal . . . ProValAlaProLeuThrLysSerPheTyrGlyGluCysSerValProGluI leLeu 
METProHisArglleGlyValPheLeuArgGluProProProSerLeuProThrProIleCysProAlaThrAla 
IleThrLeuProLeuPheAlaCysMETGInlleLeuIlelleGlyGlnGluLys . . . LeuIleLeuValValLeu 
GluAspLeuGluSerLeuSerValGlyLeuThrSerProLysLeuValCysLeuMETGlyValGluPheLysIle 
ArgGlnGluLysAsnMET. . . LysLys . . . SerProAsnSer ProGlyTyrMETAiaProLeuAlaProThrLys 
Asp. . . IleSerGlnAsnTyrMETLysProSerValProIleLeuAlaTrp. . . AlaTyrLeuIleProProSer 
LeuGlySerMETArgSerArgProLysThrLeuLeuThrValGlyTyrAIaSerPro . . . ThrSerGlyHisMET 

PheGlnSerLeuTyrLeuAsnAsnGlyThrThrSerAlaGlnLys . . . Thr ProLeuProPhe AspLeu 

LeuPheProIleTrpLys . . . ProIleProGlnThrSer ProVal . . . AsnLeuAlallsLeuHisThrGInPro 
ThrProAsnAlaSerGlyGly . . . LeuLeuProHisLys . . . SerAlaTyrProGlnGluTyr PheLeuSerVal 
ValProGlnProIleValVal . . .METAlaLeuGlnAsnLeuCysAlaSerSerHisSer . . .CysProLeu. . . 
ProSerThrLeuAsnLysIleTyrThrValMETSerTyrLeuSerProA.laThrLysGluTyrProPhePheLeu 
LeuLeu. . . GluGlnGluCys . . .ValHis. . . ValLeuAlaLeuAlaValSerGlnProLeuLeuSerSerThr 
ThrAsnTyrLeuLysAsn. . -METGlyThrTrpAsnGlySerProThrProTrpSerProCysLysIleAsnLeu 
ThrPro. . .GlnGln". . . SerPheLysIleGluGluLeu . . . ThrCys . . . ProLeuLysGluGlyGluProVal 
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TyrPhe . . . GlyLysAsnAlaVallleMETLeuileAsnProGluSerSerLeuArgLysLeuLysLys PheGlu 
IleGluTyrAsnValGluGlnArgSerPheGluThrLeuAspProGlyAlaSerSerAlaAsnGlyCysProGly 
PheSerProSer . . .AspLeu. . . GlnLeu. . . TyrCysTyrSerSerLeuAspFroVaiSerLeuTr.rSerLeu 
LeuThrLeuSerLeuProGluSerLysLeu . . . AsnTyrLysTrpSer ProArgCysSerProArgleuArgSer 
ThrAlaAspProTrpThrGlyLeuLeuAlaHisAspLeuMETLeuMETThrSerLysAlaProLeuLeuArgLys 
SerGlnLeuHisAsnLeuTyrTyrAlaProIIeGlnGlnGluAlaValArgAlaValValGlyGlnProProGln 
GlnHisLeuGlyPheProValGluMETGly 
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AlaProSerGlyGluGlnArgThrGlyHisTyrProGlyGluAspTrpGlnLeuIleLeu?roThrSer?rcAsn 
LeuArgAspPheSerlleTyr . . . SerGly. . . IleLeuSerArgValGlyGlnArgProSerProValGIyGln 

LysArgProLysArg ArgHis . . . PheMETLys . . . PheProAspSerAspPheProGIuAlsTyrArg 

ValThrlleAlaLeuLeuSerArgProGln . . . ProArgGluTyrProArgArg . . . ValTyrAspIleThrTyr 
ThrAlaProGluGlyHisSerProGlnGlyArgSerArgLys . . . METLysHisSerLysAspI le . - . LysSer 
LysProArgLysProThrSerHisGlyLeuLeuCysCysLeu . . .Pro. . . LysGluSerAlaThrPheProLys 
LysGlnAspLeuAlaHisThrLysCysCysMETGluGlyProSer . . . ProMETThrLeuCysLeuThrGlnAsp 
SerGlnLeuSerCysArgHisHisLeuLeuSerGlnlleSerThrSerSer . . . Asr.IIeThrArgAsnLeuSer 
LeuArgArgGlyLysArgThrlleProProLeu . . . HisGlylleSerGInValProSerLeu . . .PheProIle 
ProArgTyrlleLeuGlyArgThrLeuProSerHisPhelleTyrProAsnCysGly. . . SerGiyTrpSerGly 
ValLeuAspThrSerHisLeuSerGlnlleLeuAspThrAlaLysGlyThr . . . LysSerArgArgGInArg . . . 
LeuPheLeu. . . ThrSerArgGlyPheAlaProAlaLeuGlnThrThrThrArgArgLysValThrLysIlelle 
AsnProHisGlyProProLeuSerTyrPheSerLeuTyrCysSerPheThrLeuPheHisSerHisCysThrPro 
SerMETProLeuTyrAspGln. . . LeuProLeuProArgValSerMETGluAsnAlaAlaSerArgLysTyr . . . 
CysProIleVal . . . GluSerPhe. . . GlyAsnProHisLeuHisCys ProHisProTyrAlaProGlnLeuLeu 
SerLeuCysHisSerLeuHisAlaCysLysTyrSerLeuLeuAspArgLysAsnAsp . . . Ser . . .LeuSerTrp 
ArgThrTrpSerHisCysLeuLeuAspLeuLeuHisProAsnTrpTyrVal . . . TrpGlyTrpSerSerArgSer 
GlyLysArgLysThrCysLysArgSerAsnLeuProThrHisProGlyThrTrpHisLeu . . . ProLeuGlnArg 
ThrArgSerLeuLysThrThr . . . AsnProProTyrProTyrSerProGIyLysProIle . . . TyrHisProHis 
TrpAlaPro. . . GlyLeuGlyProLysProTyr . . . LeuLeuAspMETProProProGluLeuGlnAlalleCys 
PheAsnProCysThr . . . ThrMETGluGlnLeuGlnHisArgAsnLysHisHisPheArgPheSerArgThrSer 
CysPheGlnSerGlyAsnAsnProTyrLeuLysProHisLeuCysLysIle . . . GlnTyrTyrl leHisAsnGln 
LeuProMETHisGlnValGlyAsnSerSerHisThrAsnSerLeuProThrLeuArgAsnllePheCysLeuTrp 
TyrLeuSerLeuSerLeuPheGluTrpLeuPheArglleTyrValLeuProLeuIleLeuSerAlaProTyrAsp 
HisLeuHis. . . ThrArgPhelleGlnLeuCysHisIle . . . AlaProGlnGlnLysSerThrHisSerSerPhe 
CysTyrArgSerArgSerAlaArgCysThrArgTyrTrpHisTrpArgTyrHisAsnLeuTyrSerValLeuLeu 
GlnThrlleSerArgThrLysTrpGlyHisGlyThrGlyArgArgLeuProGlyHisLeuAlaArgSerThr . . . 
LeuProSerSerSerSerProSerLysSerLysSer PheArgLeuAlaAsnArg . . . LysArgGlyAsnLeuPhe 
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IlePheArgGlyArgMETLeuLeuLeuCys . . . Ser IleArgAsnArgHis . . .GiuSer. . .ArgAsnSerArc 
SerAsnThrThr . . . SerArgGlyAlaSerLysHisTrpThrLeuGlyProProGInProMETAspAIaLeuAsp 
SerProLeuLeuArgThrSerSerSerTyrAsnlleAlaThrProLeuTrpThrLeuTyrLeu. . . ProProCys 
. . . LeuCysLeuPheGlnAsnArgSerCysLysThrThrAsnGlyAlaGlnAspAIaValGlnAsp . . .AspLeu 

ProGlnThrProGlyProAIaCys . . . ProThrlle. . .Cys HisGlnArgHisProSer . . . GlyAsn 

LeuSerCysThrThrSerThrThrProGlnPheSerArgLysGlnLeuGluArgSerSerAlaAsnLeuProAsp. 
SerThr. . . ValPheLeuLeuArgTrpGly 
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TTGGTCTTAAGAACACAAATGATATGGCTCCAATGACTGGAGGAACACCAGGGTCCTTGG 

TCTCACGCTGATTTAGATAAAACGAC TGTCAGGCCTCTGAGCCCAAGCTAAGCCATCCTC 

CCCTGTGACCTGCACGTATACATCCAGATGGCCTGAAGTAACCAAAGAATCACAAAAGCA 

GTGAAAATGGCCTGTTCCTGCCTTAACTGATGACATTCCACCATTGTGATTTGTTCCTGC 

CCCATCTTAACTGAGCGATTAACCTTGTGAAATTCCTTCTCCTGGCTCAAAACCTCCCCC 

ACTGAGCACCTTGTGACCCCCGCCCCTGCCCCTAAGAGAAAACCCCCTTTGATTATAATT 

TTCCACTACCCACCCAAATCCTATAAAATGGCCCCACCCCTATCTCCCTTCGCTGACTCC 

TTTTTCGGACTCAGCCCGCCTGCACCCAGGTGAAATAAACAGCCTTGTTGCTCACACAAA 

GCCTGTTTGGTGGACTCTCTTCACACGGACGCTCATGACATTTGGTGCCAAAACCTGGGA 

TAGGAGGACTCCTTCAGGAGACCAGTCCCCTGTCCTTGCCCTCACTCTGTGAGGACATCC 

ACCTACAACCTTGGGTCCTCAGACCAACCAGCCCAAGGAACAGCTCACCAATTTCAAATC 

AGGTAAGCAGTCTTTTCACTCTCTTCTCCAGCCTCTCTTGCTACCCTTCAAACTCCCTCT 

CTCACTACCCTTCAATCTCCCTGTCCTTCCAATTCCAGTTCTTTTTCATCTCTAGTAGAG 

ACAAAGGAGACACATTTTATCCATGGACCCAAAACTCCAGCACCAGTCACGGACTTGGGA 

AGACAGTCTTCCCTTGGTGTTTAATCACTGCGGGGACGCCTGCCTGATTATTCACCCACA 

CTCCATTGGTGTCTGATCACGGTGGGGACACCTGCCTTGGTCACTCACCCACATTCCCTT 

GGTGGTACGTCAACTGCAAAAGCAGGGGACGCCTGCTTTGGCTGCTCACCCACCCCCTTC 

TCTGTGTCTCTACCTTTCTCTTTAAACTTACCTCCTTCACTATGGGCAAACTTCTGCCCT 

CCATTCCCCCTTCTTCTCCCTTAGCCTGTGTTCTTAAAAACCTAAAACCTCTTCAACTCA 

CACCTGACCTAAAACCTAAATGCCTTATTTTCTTCTGCAACACTGCGTGGCTGCAGTACA 

AACTTGATAATAGCTTTAAATGGCCAGAATATGGCACTTTCAATTTCTCCATCCTACAAG 

ATCTAGATAATTTTTGTGGAAAAATGGAAAAATGGTCTGAGATGCCTGACGTCCAGGCAT 

TCTTTTACACATTGGTCCCTCCCTAGTCTCTGCTCCCAATGCGACTCATCCCAAATCTTT 

CTTCTTTCTCTCCTGTCTGTTCCTTCAGTCTCCACCCCAAGCTCTGAGTCCTTTGAATCC 

TCCTTTGCTACAGACCCATCTGAACTCTCCCCTCCTCCCCAGGCTGCTCCTCACCAGGCC 

GAGCCAGGTCCCAATTCTTCCTCAGCCTCTGCTCCCCCACCCTATAATCCTTTTATCACC 

TCCTCTCCTCACACTCAGTCCGGCTTACAGTTTCGTTCTGTGACTAGCCCTCCCCCATCT 

GCCCAACAATTTCCTCTTAAAGAGGTGGCTGGAGCTAAAGGCATAGTCAAGGTTAATGCT 

CCTTTTTCTTTATCTGACCTCTCCCAAATCAGTTAGCGTTTACGCTCTTTTTCATCAAAT 

ATAAAAACCCAGCCAGTTCATGGCCCATCTGGCAACAACCCTTACAGGCTTTACAGCCCT 

AGACCCTGAAGGGTCAGAAGGCCGTCTTATTCTCAATATGCATTTTATTACCCAATCCGC 

TCCCAACATTAAATAAAGCTCCAAAAATTAAATTCTGGCCCTCAAACCCCACAACAGGAC 

TTAATTAACCTCACTTCAAGGTGTACAAGAATAGAGTAGAGGCAGCCAAGTAGCAACGTA 

TTTGAGTTGCAATTCCTTGCCTCAACTCTGAGAGAAACCCCAGCCACATCTCCAGCAAAC 

AAGAACTTCAAAACACCTGAACTGCAGCAGCCAGGCGTTCCTCCAGGACCACCTCCCCCA 

GGATCTTGCTTCAAGTGCCGGAAATCTGACCATTGGGCCAAGGAATGCCTGCAGCCCAGG 

ATTCCTCCTAAGCCACGTCCCATTTGTGCAGGACCCCACTGGAAATCGGACTGTCCAACT 

CACCCGGCAGCCAATCCCAGAGCCCCTGGAACTCTGGCCCAAGGCTCTCTGACTGACTCC 

TTCCCAGATCTTCTCGGCTTAGCAGCTGAAGACTGACACTGCCCGATCACTTCAGAAGTC 

CCCTGGACCATCACGGATACTGAGCTTCAGGTAACTCTCACAGTGGAGGCTAAGTCCATC 

CCCTGTTTAATCGATACAGGGGCTACCCACTCCACATCACCTTCTTTTCAAGGGCCTGTT 

TCCCTTTCCCCCATAACTGTTGTGGGTATTGACGGCCAAGCTTCAAAACCCCTTAAAACT 

CCCCCACTCTGGTGCCAACTTGGACAACATTCTTTTATGCACTCTTTTTCAGTTATCCTC 

ACCTGCCCAGTTCCCTTATTAGGCCGAGACATTTTAACCAAATTATCTGCTTCCCCGACT 

ATTCCTGGGCTACAGCCACATCTCCTTGCCGCCCTTCTTCCCAACCCAAAGCCTCCTTCA 

TATCTTCCTCTCATATCCCCCCACCTTAACCCACAAGTATGGGACACCTCTACTCCCTCC 

CTGGCAACCGATCACACGCCCATTACTATCCCATTAAAACCTAATCACCCTTACCCTGCT 

CAATGCCAGTATCCCATACCACAACAGGCTTTAAAGGGATTGAAGCCTGTTATCACTTGC 
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CTGCTACAGCACGGGCTTCTAAAACCTATAAACTCTCCATACAATTCCCCCATTTTACCT 
GTCTAAAAACCAGATAAGTCTTACAGGTTAGTTCAGAATCTGCACCTTATCAACCAAATT 
GTTTTGCCTATCCACCCTGTAGCACCCAACTCGTACACTCTTTTGTCCTCAATGCCTTCC 
CCCACAACTCACTATTCCGTTCTTGATCTTAAAGATGCTTTTTTCACTATTCCCCTGCAC 
CCCTCATCCCAGCCTCTCTTTGCTTTTACCTGGACTGACCCTGACACCCATCAGTCCCAG 
CAGCTTACCTGGGCTGTACTGCCGCAAGGCTTCAGGGACAGCCCTCATTACTTCAGCCAA 
GCTCTTTCTCATGATTTACTTTCTTTCCACCTCTCTGCTTCTCACCTTATTCAATATATT 
GATGACCTTCTACTTTGTAGCCCCTCCTTTAAATCTTCTCAACAAGACACCCTCCTGCTC 
CTTCAACATTTGTTCTCCAAAGGATATCGGGTATCCCCCTCCAAAGCTCAAATTTCTTCT 
CCATCTGTTACATACCTCGGCATAATTCTTCATGAAAACACATGTGCTCTCCCTGCCAAT 
TGCGTCTCCAACTGATCTCTCAAATCCCAACCTCTTCTACAAAACAACAACTCCTTTCCC 
TCCTAGGCATGGTTGGATACTTTTGCCTTTGGATACCTGGTTTTGCCATCCTAACAAAAT 
CATTATATAAACTCACAAAAGGAAACCTAGCTGACCCCATAGATTCTAAATCCTTTCCCC 
ACTCCTCTTTCCATTCCTTGAAGACAGCTTTAGAGACTGCTCCCACACTAGCTCTCCCTG 
TCTCATCCCAACCCTTTTCATTACACACAGCCGAAGTGCAGGGCTGTGCAGTCGGAATTC 
TTACACAAGGACCGGGACCATGCCCTGTAGCCTTTTTGTCCAAACAACTTGACCTTACTG 
TTTTAGGCTCGCCATCATGTCTCCATGCGGTAGCTTCCGCTGCCCTAATACTTTTAGAGG 
CCCTCAAAATCACAAACTATGCTCAACTCACTCTCTACAGCTCTCACAACTTCCAAAATC 
TATTTTCTTTCTCACACCTGACGCATATACTTTCTGCTCCCCGGCTCCTTCAGCTGTATT 
CACTCTTTGTTGAGTCTCCCACAATTACCATTCTTCCTGGCCCAGACTTCAATCTGGCCT 
CCCACATTATTCTGGATACCACACCTGACCCTGATGATTGTATGTCTCTGATCTACCTGA 
CATTCACCCCATTTCCCCATATTTCCTTCTTTTCTGTTCCTCATGTTGATCACATTTGGT 
TTACTGACGGCAGTTCCACCAGGCCTGATCGCCACTCACCAGCAAAGGCAGGCTATGCTA 
TAGAATCTTCCACATCCATCATTGAGGCTACTGCTCTGCCCCCCTCCACTACCTCTCAGC 
AAGCCGAACTGATTGCCTTAACTCGGGCCTTCACTCTTGCAAAGGGACTACACGTCAATA 
TTTATACTGACTCTAAATATGCCTTCCATATCTTGCACCACCATGCTGTTATATGGGCTG 
AAAGAGGTTTCCTCACTACGCAAGGGTCCTCCATCATTAATGCCTCTTTAATAAAAACTC 
TTCTCAAGGCTGCTTTACTTCCAAAGGAAGCTGGAGTCACACACTGCAAGGGCCACCAAA 
AGGCGTCAGATCCCATTACTCTAGGAAATGCTTATGCTGATAAGGTAGCTAAAGAAGCAC 
CTAGCGTTCCAACTTCTGTCCCTCATGGCCAGTTTTTCTCCTTCCCATCAGTCATTCCCA 
CCTACTCCCCCATTGAAACTTCCGCCTATCAATCTCTTCTCACACAAGGCAAATGGTTCT 
T AGAC C AAGGAAAAT AT CTC CTTCC AG C CT CAC AGGCCC ATT CT ATT CTGT C ATC ATTT C 
ATAACCTCTTCCATGTAGGTTACAAGCCACTAGTCCACCTCTTAGAACCTCTCATTTCCT 
TCCATCGTGGAAACATATCCTCAAGGAAATCACTTCTCAGTGTTCCATCTGCTATTCTAC 
TACCCCTCAGGGATTGTTCAGGCCCCCTCCCCTCCCTACACATCAAGCTCGGGGATTTGC 
CCCTGCCCAGGACTGGCAAATTGACTTTACTCACATGCCCTGAGTCAGGAAACTAAAATA 
CCTCTTGGTCTGGGTAGACACTGTCACTGGATGGGTAGAGGCCTTTCCCACAGGGTCTGA 
GAAGGCCACTGCAGTCATTTCTTCCCTTCTGTCAGACATAATTCCTTGGGTTGGCCTTCC 
C ACCTCTAT AC AGT C CAAT AACGG AG C AGC CTTT ATT AGT C AAAT CAC CTGAG C AGTTTT 
TCAGGCTCTTGGTATTCAGTGGAACCTTCGTACCCCTTACTGTCCTCAATCTTCAGGAAA 
GGTAGAATGGACTAATGGTCTTTTAAAAACACACCCCACCAAACTCAGCCTCCAACTTAA 
AAAGGAGGATAGAGCCCAAAAACTCGCAACCAAGCTAGTAATTATGCTGAACCCCCTTGG 
GCACTCTCTAATTGGATGTCTTAGGTCCTCCCAAATCTTAGTCCTTTAATATCTGTTTTT 
CTCCTTCTCTTATTCGGACCTTGTGTCTTCCGTTTAGTTTTTCAATTCATACAAAACCGC 
ATCCAGGCCATCACCAATCGTTCTATACAATAAATGCTCCTTCTAACAACCCCACAATAT 
CGCCCCTTACCACAAAATCTTCCTTCAGCTTAATCTCTCCCACTCTAGGTTCCCATGCCG 
CCCATAATCCCTCTCGAAGCAGCCCTGAGAAACATAGCCCATTATCTCTCCATACCACCC 
CCAAAATTTTTGCTGCCCCAACACTTCAACACTATTTTACATTATTTTTCTTATTAATAT 
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AAGAAGAC AG C AATGT CAGGCCT CTG AGC C C AAG C C ATC AT AT CCCCTGTG AC CTGC AC A 
TATACATCCAGATGGCCTGAAGTAACTGAAGAATCACAAAAGAAGTGAAAATGGCCTGTT 
CCTGCCTTAACCGATGACATTCCACCACTGTGATTTGTTCCTGCCCCACCTTAACTGAGC 
AATTAACCTTGGGAAATTCCTTCTCCTGGCTCAAAACCTCCCCCACTGAGCACCTTGTGA 
CCCCTGCCCCTCCACTACCCACCCAAATCCTATAAAATGGCCCCACCCCATCTCCCTTAG 
CTGACTCCTTTTTTGGACTCAGCCCGCCTGCACCCAGGTGAAATAAACAGCCTTGTTGCT 
CACACAAAGCCTGTTTGGTGGACTCTCTTCACAGGGAC GGGGGTGACAACAACACGGACA 
CACATGGAGTGGTTTTAAGGAGCAGAGAGTTTAATACGCAAAAAAGAAGGAAGAGGCTCC 
CCTGTACAGACACAGAGGGAGGGGGCTCCAAGCCGAGAGAAGGAAACCCCATGTGCAGTG 
GAAAAGTGGTTGATTATACTGGGAGGCTGGAGGAGGCGGTGTCTGATTTGCACAGGGCCC 
AGGGGATTGGGTTGACCAGGTGTATCATTCATGTACCCCGCAAAAAACCTGGCCCTCCCA 
CCTCAGCCCTTTAATATGCAAATGTGGGTTGCCATGATGTTCTGAAAACACATGAATTAT 
CTGGAGGGGGCCATGACACTTGGTACATGTGCTGACAAGAAGAGGGTGGGAATCGCCATG 
GTGGCCATGTTGGGTGGACCTAGTTTTTAATAGCCTGCATTTGCATATCAAAGTTTGCTG 
GCCTGGCTCTTTAAGCTGTCTTTTCTGTTAGAAAAGGAATGGTTTGGAATGGGTGAGGGT 
TGCTTCTTATTACAAGAAAATTTCCAAAAACCTTTACTCTTTCTAGCTGCCAAAAAACTA 
TTTCTTAATAACTTATGTATTACCATAATTAGGCAGCACCAAAGATCCCTGCAGGTCAGA 
CCACTGCAATTAACATGCTGGCTTTACTGCTGATTATGGTAGCTGCATCCACCTAGCCTC 
TCAT ATTG C AACTG C CTGACCT CTG C C AC C C C ACGAG C C ACTTAT C C CC ACTT AT AAT C A 
GCCCATTTCGATTGTAACATCTGCCACTTATTCCCGACGTTGTGGTATATCCTATAGATG 
AATTCATTCAACATCCATTCCAACACCACCTCTCTTGCCTTCCTATACTCTCTGGAGAGT 
GAATTACTGAGTCACATGATCTTCACTGCAGTCATTTGTGGCTATGTGACATAGTTCTGG 
ACAGTGAACAT AGACAGAAGT CCCTGGGGCGGGCTTCCTTTCTGGGA TGAGGGCAAAACG 
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GATCTCTTGATCCCAGGAGGTCAAGGCTGCAATGAGCTAAGATCAAGCCACTGCATTCCA 

GCCTGAGTGATAGTGGGAGACCTTGTCTTTAAAACACACACACACACACACACACACACG 

AGGGCCTTTGACCACTCTTGAGTAGAAGACTCGAGAAGAACAAAGTAGAAGGCCAGAGAA 

GAACAAAGTTACTTGAAAGATCTCTTATTAAAGAGAATGTACAAGCTATGAAAAAAAAAA 

AACACACACACACACACAAACCTCATCTGGAATGAAAAAAACATAATGCATTTGGTTTCT 

GGTTCCTTAGGCTGTTATGGAACAACCAAAGAACATTATTTTGGTTTCTGAGGTCAGAAC 

TATTTTATTCCCCTCAAGCACACTATGCTTATGGTTTGAGGGAGAATGAGAAATAGGAAA 

CTAGGAACAGGCTGAAATGGTCTAATCTTGACCATCTAATTCTGCAGTGTCTTATTCTCA 

TTCTAAAAGAGAATGGTTATATTCGCTGTTCTAGCATAAAAAGTAATGATAAAAATAAAA 

GATCCCGTATTACCAGACAATAATCCCCTAGACTGTTTTAATGCTTGGTTGAGTATTTGC 

TTATGATCTCAGACTTTAAAAGATGGTCTCCCCCTATGGTGAAGCTTGTTAATTATGTAG 

GCATCATTAATGTCTGTTTACTTATCAAAATTTTATCATTGTTAGTTGTATTACTACTTG 

ACAGTCCAATTTATTTAATTGAAAAGATTGGTTAACATTTTATAGTCAAAGTAATTGTTT 

CCTGTGTTTTTTCCTGTTTAG GTTATTGGAGTGATGAGTAAAGAATACATACCAAAGGGC 

ACACGTTTTGGACCCCTAATAGGTGAAATCTACACCAATGACACAGTTCCTAAGAACGCC 

AACAGGAAATATTTTTGGAGG GTAAGTAAGGGAAATTTCTTCAGACCCATTAAATGTTAG 

GAAAAAATGGAGCTAAAAGAGCTGGGTGGCTCACCTTTCTCATCCTGTGCTGAGAAATGC 

TGGGGCTCACCCATAAGTATCCAGCATCCCCATGGACACAGGGAATTCTGAACAAATGTG 

ATGAAACCGATGAAATGTCTGGCCTGTAGGTGGTTAGTGATGGAGATACGGGCTATATGT 

GAATCTTGATTTTTGCAATTCATTAGAGCTTTGTAATGAAAGGAAACAGTTTGTTGCTTG 

CTTTAAGGATAGGTTCATTTGCATTTCTCCGCAAGGAAGTAGTAATGAGTTACCAAGCCT 

TAGATTTCACCCCTTTTTGATTTCTTGCTGACTTAACTTTAATTGAATGGAAGAGTTATC 

ACAAATGAATTATCTTTTTGGTTTTTTTTTTTTTGAGATGGAGTCTCACTCTGTCACCAG 

GCTGGAGTGCAATGGCATGATCTCGGCTCACTGCAACCTCCGCCTCCCAGGTTCAAGCAA 

TTGTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTAAGGTGCGCGCCACCATGCCCAGTTA 

ATTTTTGTATTTTTAGTAGAGACGGGGTTCCACTATGTTGGCCATGATGGTCTCGATCTC 

TGGACCTCGTGATCCGCCCACCTTGGCCTCCCAAAGTGCTGGAATTACAGGCAAGAGCCA 

CCGCGC C CAGC C AGGAATGACAAATGAATTAC CTTATAAGTAAATG CC ATT AAGGAAGG A 

TAGCTGGAAGATGGGTTGAGGGGAATGGAGGACCACAGAACTAGTCCTATTTAAATACAT 

GTGCATGGTAAAATGATTCCATTTGACAATAGGTTAATTATCTCATAGCATAAGGAAAAT 

GCTTAACAGTCATATGCAAGATGATAAGCTTTCCTATAGCATCCAACCAAAAGATCTAGC 

CAGTACAATTTC CTTTG CT AT ATTAGGGTTAGAAAGGCC C CCAGAGGTGAACCAATTAGA 

TGGAATCCTTGAATAAAACACTGGATTAGCAGTGAACAGAAAAAAGTCAGATTGCTTTCC 

TTCTTCCCATAGATGTCTCAGGGATATTTAGTTTCCTCAGAAGATAAAGAATTTAGTAAG 

CGTTTTTTTGTGCATACTTACATGAAATGTACATTATTTGAATTCTTTAAAAAGAAACAG 

CTGCATGATAACAAAAATTGTGTTATGCTTGCTTTAGCTGGTATTTTTGCCTAGAACGAT 

TATATCGTTCGGACAAGAAGCTATTCCTAAGAAACAATATTTTTAATCCAGGAAGTTTTT 

CATTTTTAGAAATTTATCTTACTATTTCCCAAGCAAAAGAGGGTAGTTACAGATTCACTA 

AGAATCATGTGCTCACAATTTTTATTTAATAATTATTCCTCCTTAAAATATATTAATCAC 

CTGACTTACAATGGTGGAACCATGAGTGCATTTTTGCCTTTATTGTCAATAACGTCTTCT 

CAGAAGTGAGCCACAAAGGTGCATAGTTCTTGGAGTTAAAGGTCTGAATTAAGACAATCC 

AGCATAAGTCTCATTAATGTGTGATTATTTTGAGAAAAGGCAAGAAGTACCTAAGAATCT 

CCCCCTCACTGTCCAGTTCCCTGTTTCATTTAAAGATTCACTGTAAGTAACTGAAAGGCT 

TTCCTTGGGAGGATTTATTTGAATCAGTCTTTCACATGCAAAGGATATTGTAGAACATCT 

CGTTTTTGCTGGCAGGAATATGAACATCTGTTGTGAGGAAAGAAAAAGTTTCATGCAAAT 

TACACTGCCAAAGAAGGGATGTTCAAGTTGAGAAACCAGTGACATTTCTTGTAACTGTAC 

TATGAATCAGCGCATTTTAATCTTCTAGATAATATATGGAAGTGCAGGAAGGTGGTAGGA 

AACGGTGTTCATTTTACATATGCGTTATTTTATTCTGTGTGAGTGACTTCATGGCACCGA 

CATTGCTGTTTTTAAATGAGGATACAGTAAATTGCAGTCCGAGGAAGGCTAACTGGAATC 

AACATAC CCGTAGCTTTAGAAAGCAGTTTCCGC AC CAGCGAAGAGTACAAG AGCGATGGA 

ACCCCATGTTCCTGGAAGTTTGC ACATCAGAGTAAACAAACTTGAAAAC C C CTCTTG AT A 
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GCAGAATTCACCCAGCCTTGTTCCATTTTCTCTTAACAAAACACACCGCAAAAGCTCTCA 

CAAGCTGCTTTGATGAAGCCACATGTATTTCCCCCTTCACAATTTACAGGAAGTTACTCT 

TAAAAGAAAGTGATTCTGGTGTTTACCGCCTGTGTTAAAGGGACAGAGTTCCTTTTTATT 

TCTGATAACGTTTGAGCGAAATACAGAAACTATCTGTAGACTAGCATAGTCGGTACGTGA 

GTAAGGAAAAGCAATAACCTGCTGTCCGGTGAGCACAAAATTCCTGCTACGAACAGTGCC 

TTACTGCTGCTTGGAGACTGCAAGTCGCAGATCACACTAGGTATTGACTGATTGTATAAG 

GAAATTTCTTAAAGT CTAAAGTAAAGGTGGT AC CTC CTAAAAAGAGGGGAAGAGAG AAAA 

CTTTGTGTGGAAGGATAAGGAGTGTGTTTATAGTTTCAGTAAGAGTGTACGTTTTAATTT 

TTCTTCTTCCTCTGCCTCTTTGCCAAGTAGCCTGAGTGCATCTGTTATCCAGAAGTAGTA 

TTACTCTAGGACAAACTTCAAATTCTTCATTCTGCGTTGCCTTTAAGGAACAACATACTT 

TCTTCCTGTTCTTTTTCCAAAAACACACGCCTATGGCTCTGTGTGTGGTGTTTTAGCCAG 

CCTCCTCCCAGATAAGGGGTTCCCTTCCCTCCTTTGCATTGAAAGGAAAGTGCAAGTCTG 

GACATGTTTATCAAGAGGAAAAGTGACTTCTCAGTAATAGACTGTCAAATTCGGGCTGCT 

GCCCGAGTGTTCGCTTTGTTATGGCAGGTGAAGTTCACCTTTGCCCCACCCAGTGTTTCC 

ACAAAAAGGCAAGGTTCCAAGTATTCATATGAACAAGTGTTACTTTAGGACTTGGAGGGT 

TGGGGGTGGAGGATGTTTGCATAGTTGAAGCCTTGGGCGGGGGTGTAGGAAACGGCGAGT 

ACAGAGGCCATAGAAAAAGCTAAGACTCAGTTTGACGTCGTCAGCCGGCTTGGTCTTCTA 

CCCAGTGACTCAAAGCACTAAAAGTCAGCATAATCGGAACTGAAGTCAGTAGCATCGCCC 

ATTTGCCATTCACTGCAGTAGCAAAAGTAGTACTCTGTGGTGGGTTAATCGGTTTGAGGC 

AGCTCCTTAAATGAACATTTGTGTTTCATTTTTCTGTTATTTTCCCGAACATGAAAAGAC 

GATAAAACTGAAATGGAAAAGGTAACTGACAAAAGTGTGCCTTACCTGTTTCCGCCCTGA 

TTTCTGCTGATTCAAGACTATTCTGGCTAAACTGATTGGATTCTTTTTCTAACTAGGCAG 

TAGGGGATCAGAAATCACACACGGTACCGGCTGTGTTTATTCTGAGAGGTGCTGGGGAGC 

TTTGGGTCTGACTTCCTTTTACATGCCTGTCTTCTCTTTTGGACAG ATCTATTCCAGAGG 

GGAGCTTCACCACTTCATTGACGGCTTTAATGAAGAGAAAAGCAACTGGATGCGCTATGT 

GAATCCAGCACACTCTCCCCGGGAGCAAAACCTGGCTGCGTGTCAGAACGGGATGAACAT 

CTACTTCTACACCATTAAGCCCATCCCTGCCAACCAGGAACTTCTTGTGTGGTATTGTCG 

GGACTTTGCAGAAAGGCTTCACTACCCTTATCCCGGAGAGCTGACAATGATGAATCTCA G 

T7UVGTGGATTACAGAACAAAAAAATAAAAAATGCCAGTAATGTCGGTTCTGCCCCTTTGA 

ACTAATAACATGTTGTTTAATTATACGGCTTTGTCATGTGTTGGATGAAGTAGGTGGCTT 

AAGCTAGGGACTAGGAAGAGGAAAAACATTTTTTGAGTCCCTATTAACTATTAGGAAACT 

TGATCATTTAAAAGTATATATATATATGAGGAGCTACCTTGAGTTTTGAATTCAGGATGT 

TACAGGAAGAAATATATGTCCAATTCTAATTTATCCAAAAGCAGTTGGGAGAATTACAGG 

GATTGGTCCAGACATGCTGCGTATGCAAGGTATAGCCCTCATCTGTGGTACTTTGGCAGG 

GCTTAGACTGCATCAAAATATTTATAGATGTACATTTGAGTGTACAGTTAGGATCTGATG 

TGGAACATTGTAAGATCATTGCTAGAAAAACTTTGTCATAATTTTTCAATATTATTCTAA 

GTGAATAACCGTAAAGATTTTACATCTTAGCTTCCTTCCTTACAGTAAAAAAACTATCTG 

ATCTCTTGATC AGT ATT ATAGTAGCCACCT ATCACTTTAT C TTAACAAATTCTCAATTC C 

TTAGGTTTATGTGCTTTTACTTCTTTTATTTGATTAAAATTGCTGTCATGACCTCTCTCT 

GCAGAGGGCTGCATCATTTTGGTCATTCTCAAGTGATCTCTTTGAGCAATTTAAGAATTG 

CCATAAGATTCTAACCTCTGCTGTAACTATGGTTGTGTGTTCTTGGTTAGACCACTAAAT 

CTTATTAGCAGTTTTAAAAATTATTCCTTTTGGTTTAGAAGTTAAGACTAAATGCTGAAG 

TTTTTGTAACTTTTGGTTTTGATATCATTTCAAACTTAAGAAAACATTTGAAGAAAAGGA 

CAAAGAATTTC C ACTTACCCTTTACC CAGGTTTAC CAGTTATTGATAAGTATATCCATTT 

GCTTTACCAGAAGGCTAACTTGTTTTAGTTCTCATTTTCACCTTTGAGACATTTGGAATA 

AATATCAATGTTAACATAAATTGGAATTTTGACTTTGATTTTAGGACCAATGAACAAGCC 

AAGTACTTAC CC T AGTC ATATATAATCCAACTGTATGGTTATTTGGTATTCATTCCACAC 

TTCATTTTACTTGATCT CC CTTAAGATTGCAAGATTGTGTTTG CAGTTTTT CTGAAAAT C 

TGGGGCTATAAAAGCATCAGGACCTCCCCCGTAGGGGAGGTCGTGTGTTTGGGGTCCTTA 

CACAACAGGTTACCCTTGAGCTTCAGGAAAAGAACTGGCTCTCAGTTCCCCAGTTCCAGC 

TTAATGGGTCTAATTAGGTCCTGACCAAAAAGGTGGCAGTTCTTTTCCCTCATGTCTCTT 

CAGCGCTCCCCGAGACTCTGGAGACTCTGTCATATCCCTAGGGCTGAGCCTCCCAGGAAC 

CATTCGGCTGTTGTGGCATCTGTGTATGCCATGCCCAGTGCTGAGGACCTAGTAACAAAC 
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GACAAATGCACAGGCACAGTGGCATTTTTGTGGAACTCGTATTCCAGCTGTGCGTCTCAG 
AAGAAGCGCACAGCTCCCTCCTGGCTTTCTTAACATAGTGAGCCACTTCCACTTAAGGGT 
CTCCTTACATTCCTTGAGTTTAATCATTCATGGATTCAGAGGAAAGTCTTTTGATTTTTG 
CTTTTCTTTAAACAGTTCATTTGAGGTGACCTACCCCAGTGACTTTGCACCAACCACCAA 
GAAACTTTTTTGCATGCTTCCCGCACCCTGTGCCAATCAAGGGAAGGGTTTAAAGGCCTG 
GCGTTTTTATTCCTCAAAGAAAGGTTTTGCACAGTATTTTAAGGTTCAAGTGCTTCTACT 
TTGTGTTCAGAAGCAACTGTCATATATACTGTGAAATGACACCTTTTATTTATCCCTTTT 
TATTTATGCAGTATGTCCCCTTTTATTTTGGCAGAATTTTTTCTAAATGGTGGTTTAACA 
TTTTCAAGCACATTTCATTGTCCAATATTCATAGTAAAGAATGAGAGTTAACAATAACCA 
GTCACATTAAAACAAGATTCCTGCTGCCAGTTGTGAAACCGGTTGTCTTAGGCGTGGCAG 
CTGATGATTGAGACTGTGATCAGGAAAATTTCCACTATTTCATCAGGCCTAATAGGTAGA 

SSgStccaaatgaactgtgttgggtttccatgcttaaagcacaatagaggtgg^ 

IgIItctccatgagggcttaaatggcagtgatggttcaggcggtagagtttggagaagaa 

gg^tSgaaacaaaccaaaggaaagaaaagtaagtagccagaaatcacaa^ 

SSaaaaIc^^ 

caaat^agggggggaggtattttttttctatctatctaactaacccatctagaaaa 
cagttgaccaaattatagacttctaaatgttaatctgctttctcagtttcagttgaaaag 
agactttgttttgcctactgcagaacttctaggttctttcttatagtcttggggttctta 
ttaSgatcgaaaatgtgagtcggcataattaagccattcggagtcttcagaagcagttc 

A^TCTTGAAATGACTCCGTCCGCCTACAGCCATTTAAGATTTCAGAACAAAAACAGATCT 

tgatStctttttcatgttaactcaagctgttgctgagtgggagagtcagaaatgacacc 

AGCTCCACTGATTACTCAGCTGCTGAAGGATGATTTTTTAAAATGCACCTTTACTGTATA 

JggacScSaIt^ 

TTCTTTTAGAATAAGATGCAAATCTATTTTTCTGAAGGCATTAGAGATAGCAAACATTTA 

Sgtacttaagaagaatccctggctaaatgtgaggggcagtgccacagatggactgaaac 
^SSt^ttgcacatttatgctattattatttgttgaattatagaaccaa^ 

^gagggtaaagttttttgtatttccattttattcgagcggcatcgtttttaaaa^ 

SSSgLtttgaccctatatagatgtttccaaataattctttttcaccttcata^^ 

Scttcctgtggctgtgagatgccttgcctatcagttttcaagcttagttgtctt^ 

tcctttaccattttagctttaaaaaacaaaagtgacaattagaacttcctgcctgctggg 

^ctcaaSaccgatattggcctgataaggagatatttattttgttttagtggcttc 

agaaatccctctccctcagcaagctttccatcacggcccccccgtcagcatcttccctg^ 

^agcgttcttctctgtgtttattctggggcttcaggctcgcccaggaggaactgataacc 

gctggSggagataaca^^ 

gac^tatcagatagcaagtgtggagttctttctcaactaaattcaagcagagacattttt 
SSSaSaaggatatttgcacaaaggcttcagcatgatccccc^cctgctgcctct 

gaa^tctccacacattc*^^ 

tggttoccaggcaaggctgagcagggaattttcagttttccctgcccagatgggtgtttt 

^Scsaaggcatcatttattgtgtagcgaggagacagggctggctgtggcag^ 

ctagaactgtcctcattgctgctgttcctaaatagtatctttaccaagtaataacgtgcc 

gtctttgggaataagtgctttcctcttagcctgttctgttttcttgggtgcgctaagtaa 

^tgaactggctcaggaagtacctattgtggtttggcagaggtgactgtcacgccttgtga 

SccIggggccagcactgctgggatcctggctagaccagacagagccttggtgaagtgct 

Sgg^tgcaca^^^ 

ctctgSttacttgaaatgagtcttaatctttcacatttagttctcagggtatgctgatt 
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CCCAGTATTTTTCCACTCCATTAAAATGGAAGTTTTTTTTTTTTTTTTCTTTTTTGAGAC 
AGAGTTTTGCTCTTGTTGCCCAGTCTGGAGTGCAATGGCACAATCTCGGCTCACCACAAC 
CTCCACCTCCCAGATTCAAGCGATTCTTCTGCCTCAGCCTCCCAAGTAGCTGGGATTACA 
GGTGTGCGCCACCACGCCCAGCTAATTTTGTATTTTTAGTAGAGATGGGGTTTCTCCATG 
TTGGTCAGGCTGGTCTCGAACTTCCGACCTCAGGTGATCCGCCCACCTCGGCCTCCCAAA 
GTGCTGGGATTACAGGCAAGAG CCACTGCAT C C AGCTTAGG CT ATCTTACT C C AG C CTAA 
ACAGCAATTTTCTATCATAAGGTCTGTACTAATGAAAACAG AATCACC CAAGGCTG CTGT 
TTGTTCTGTCTGTGCTGCCATTGTCCGCATTTTGCTGAGGAGGAAACGGAACTGCACTTT 
TGAGTGAGTGGCCCAGAGCCTTCTAGAATGAGAGTGCGTTGGAAGCCAGATATGTGGCGA 
TTGTGTCGCCAGCTGTTACTCAGGTTTTCTCAAGAAGGAGGAGCAACTTTGGCAGTTTTG 
CTTCAGTTCTCTCTAGCCCTCTGTGTAATCGCCCCTTTTTCTTTATTTCAGCACAAACAC 
AGAGCAGTCTAAAGCAACCGAGCACTGAGAAAAATGAACTCTGCCCAAAGAATGTCCCAA 
AGAGAGAGTACAGCGTGAAAG AAATC CTAAAATTGGACTCC AAC C C CT CCAAAGGAAAGG 
ACCTCTACCGTTCTAACATTTCACCCCTCACATCAGAAAAGGACCTCGATGACTTTAGAA 
GACGTGGGAGCCCCGAAATGCCCTTCTACCCTCGGGTCGTTTACCCCATCCGGGCCCCTC 
TGCCAGAAGACTTTTTGAAAGCTTCCCTGGCCTACGGGATCGAGAGACCCACGTACATCA 
CTCGCTCCCCCATTCCATCCTCCACCACTCCAAGCCCCTCTGCAAGAAGCAGCCCCGACC 
AAAGCCTCAAGAGCTCCAGCCCTCACAGCAGCCCTGGGAATACGGTGTCCCCTGTGGGCC 
CCGGCTCTCAAGAGCACCGGGACTCCTACGCTTACTTGAACGCGTCCTACGGCACGGAAG 
GTTTGGGCTCCTACCCTGGCTACGCACCCCTGCCCCACCTCCCGCCAGCTTTCATCCCCT 
CGTACAACGCTCACTACCCCAAGTTCCTCTTGCCCCCCTACGGCATGAATTGTAATGGCC 
TGAGCGCTGTGAGCAGCATGAATGGCATCAACAACTTTGGCCTCTTCCCGAGGCTGTGCC 
CTGTCTACAGCAATCTCCTCGGTGGGGGCAGCCTGCCCCACCCCATGCTCAACCCCACTT 
CTCTCCCGAGCTCGCTGCCCTCAGATGGAGCCCGGAGGTTGCTCCAGCCGGAGCATCCCA 
GGGAGGTGCTTGTCCCGGCGCCCCACAGTGCCTTCTCCTTTACCGGGGCCGCCGCCAGCA 
TGAAGGACAAGGCCTGTAGCCCCACAAGCGGGTCTCCCACGGCGGGAACAGCCGCCACGG 
CAGAACATGTGGTGCAGCCCAAAGCTACCTCAGCAGCGATGGCAGCCCCCAGCAGCGACG 
AAGCCATGAATCTCATTAAAAACAAAAGAAACATGACCGGCTACAAGACCCTTCCCTACC 
CGCTGAAGAAGCAGAACGGCAAGATCAAGTACGAATGCAACGTTTGCGCCAAGACTTTCG 
GCCAGCTCTCCAATCTGAAG GTAGGCCTTGAGAGAGAGCAGTCCAAGGGGCTGTGAGTGC 
ATGCTTGTGTTTGTATTTAGCTTGCTTTCCATGGGGTATCGATTGCATTTGCAGTAGTAT 
GAGCCCCCGGTTGGGGATAGTGGGTATGGATTCCGCCTGGCTTTTGCCACTTCTAGCTCT 
TTGACTTTGGACAAGTGACTTCCCTTCTCCTGATTTTCTTCTGAATAATAAAAAAATTAG 
GGGTTTGGACTAGAAGATTAGGTGAAACTCCCTGCTAGCCTGTGATTTTTGTGCTTTTAA 
GAAAAACACCATTCTGAAAACATGAAGATTTCTTCTTTTTAAGACTGTCTTGATGCTTTT 
CTTAAGATATTTGCATCAACACTTGAGTCTTGGAGCAGAAATGTTAGGTCTCAGAGCCAG 
CTTGAGAGCAGAGCTAACACATGTGGCTTCTTCCCAG GTCCACCTGAGAGTGCACAGTGG 
AGAACGGCCTTTCAAATGTCAGACTTGCAACAAGGGCTTTACTCAGCTCGCCCACCTGCA 
GAAACACTACCTGGTACACACGGGAGAAAAGCCACATGAATGCCAG GTGCGCAGTATTTT 
CTGGGTAGACCTTCTGACCTTTGTAGAAAATGTCTGTGAGTCACCCTCCCATGTCCTATA 
TAGCCCGTAGTTAAAGCCAACACCAGATTCTGCGTTGTCCCATCCTGGACTGATGGCACT 
ATGGTCCTTCCCAGTACTTTGTATCTGCTGATGACTTGAGATGGCACAGCCAGCTTCCAG 
TGGGTGGGAAAATGGTAGGGGAAATAAACAGCCCCTCGTGTGCTGTGTGCCCACATCCCC 
CCGTTTGCTTAATACCACACTGGAGGTGCCACAAGGAGGCTTCTCACCTCCTAGGTTGCT 
GGGCGTTGGCCGGTAAGCCTGCCCCTCCCGTTGGCAACTCTTAATCTTCTGGCCTTCCTG 
TCTCCCTTCCCTGCTGTCTCTCTCCCCTACACTGTAG GTCTGCCACAAGAGATTTAGCAG 
CACCAGCAATCTCAAGACCCACCTGCGACTCCATTCTGGAGAGAAACCATACCAATGCAA 
GGTGTGCCCTGCCAAGTTCACCCAGTTTGTGCACCTGAAACTGCACAAGCGTCTGCACAC 
CCGGGAGCGGCCCCACAAGTGCTCCCAGTGCCACAAGAACTACATCCATCTCTGTAGCCT 
CAAGGTTCACCTGAAAGGGAACTGCGCTGCGGCCCCGGCGCCTGGGCTGCCCTTGGAAGA 
TCTGACCCGAAT CAATG AAGAAATCGAGAAGTTTGACATCAGTGAC AATGCTGACC GGCT 
CGAGGACGTGG AGGATG AC AT CAGTGTGATCT CTGTAGTGGAGAAGGAAATTCTGG C CGT 
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GGTCAGAAAAGAGAAAGAAGAAACTGGCCTGAAAGTGTCTTTGCAAAGAAACATGGGGAA 
TGGACTCCTCTCCTCAGGGTGCAGCCTTTATGAGTCATCAGATCTACCCCTCATGAAGTT 
GCCTCCCAGCAACCCACTACCTCTGGTACCTGTAAAGGTCAAACAAGT^AACAGTTGAACC 
AATGGATCCTTAAGATTTTCAGAAAACACTTATTTT GTTTCTTAAGTTATGACTTGGTGA 
GTCAGGGTGCCTGTAGGAAGTGGCTTGTACATAATCCCAGCTCTGCAAAGCTCTCTCGAC 
AGCAAATGGTTTCCCCTCACCTCTGGAATTAAAGAAGGAACTCCAAAGTTACTGAAATCT 
CAGGGCATGAACAAGGCAAAGGCCATATATATATATATATATATATCTGTATACATATTA 
TATATACTTATTTACACCTGTGTCTATATATTTGCCCCTGTGTATTTTGAATATTTGTGT 
GGACATGTTTGCATAGCCTTCCCATTACTAAGACTATTACCTAGTCATAATTATTTTTTC 
AATGATAATCCTTCATAATTTATTATACAATTTATCATTCAGAAAGCAATAATTAAAAAA 
GTTTACAATGACTGGAAAGATTCCTTGTAATTTGAGTATAAATGTATTTTTGTCTTGTGG 
C CATTCTTTGTAGATAATTTCTG CACATCTGTATAAGTACCTAAGATTTAG TTAAACAAA 
TATATGACTTCAGTCAACCTCTCTCTCTAATAATGGTTTGAAAATGAGGTTTGGGTAATT 
GCCAATGTTGGACAGTTGATGTGTTCATTCCTGGGATCCTATCATTTGAACAGCATTGTA 
CATAACTTGGGGGTATGTGTGCAGGATTACCCAAGAATAACTTAAGTAGAAGAAACAAGA 
AAGGGAATCTTGTATATTTTTGTTGATAGTTCATGTTTTTCCCCCAGCCACAATTTTACC 
GGAAGGGTGACAGGAAGGCTTTACCAACCTGTCTCTCCCTCCAAAAGAGCAGAATCCTCC 
CACCGCCCTGCCCTCCCCACCGAGTCCTGTGGCCATTCAGAGCGGCCACATGACTTTTGC 
ATCCATTGTATTATCAGAAAATGTGAAGAAGAAAAAAATGCCATGTTTTAAAACCACTGC 
GAAAATTTCCCCAAAGCATAGGTGGCTTTGTGTGTGTGCGATTTGGGGGCTTGAGTCTGG 

TGCACAAACATGGTGCTCTAC CAGGAAGG ATT CGAGGTAGATAGGCT C AGG CCACACTTT 
AAAAACAAACACACAAACAACAAAAAACGGGTATTCTAGTCATCTTGGGGTAAAAGCGGG 
TAATGAACATTCCTATCCCCAACACATCAATTGTATTTTTTCTGTAAAACTCAGATTTTC 
CTCAGTATTTGTGTTTTTACATTTTATGGTTAATTTAATGGAAGATGAAAGGGCATTGCA 
AAGTTGTTCAACAACAGTTACCTCATTGAGTGTGTCCAGTAGTGCAGGAAATGATGTCTT 
ATCTAATGATTTGCTTCTCTAGAGGAGAAACCGAGTAAATGTGCTCCAGCAAGATAGACT 
TTGTGTTATTCTATCTTTTATTCTGCTAAGCCCAAAGATTACATGTTGGTGTTCAAAGTG 
TAGCAAAAAATGATGTATATTTATAAATCTATTTATACCACTATATCATATGTATATATA 
TTTATAACCACTTAAATTGTGAGCCAAGCCATGTAAAAGATCTACTTTTTCTAAGGGCAA 
AAAAAAAAAAAAAAAAAAAAGAACACTCCTTTCTGAGACTTTGCTTAATACTTGGTGACC 
TCACAATCACGTCGGTATGATTGGGCACCCTTGCCTACTGTAAGAGACCCTAAAACCTTG 
GTGCAGTGGTGGGGACCACAAAACAACCAGGGAGGAAGAGATACATCATTTTTTAGTATT 
AAGGACCATCTAAGACAGCTCTATTTTTTTTTTGCCACTTTATGATTATGTGGTCACACC 
CAAGTCACAGAAATAAAAAACTGACTTTACCGCTGCAATTTTTCTGTTTTCCTCCTTACT 
AAATACTGATACATTACTCCAATCTATTTTATAATTATATTTGACATTTTGTTCACATCA 
ACTAATGTTCACCTGTAGAAGAGAACAAATTTCGAATAATCCAGGGAAACCCAAGAGCCT 
TACTGGTCTTCTGTAACTTCCAAGACTGACAGCTTTTTATGTATCAGTGTTTGATAAACA 
CAGTCCTTAACTGAAGGTAAACCAAAGCATCACGTTGACATTAGACCAAATACTTTTGAT 
TCCCAACTACTCGTTTGTTCTTTTTCTCCTTTTGTGCTTTCCCATAGTGAGAATTTTTAT 
AAAGACTTCTTGCTTCTCTCACCATCCATCCTTCTCTTTTCTGCCTCTTACATGTGAATG 
TTGAGCCCACAATCAACAGTGGTTTTATTTTTTCCTCTACTCAAAGTTAAAACTGACCAA 
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GTCTGGACTTGTGGTGCGCTGCCAGGGATCCGCAGCGTTGCCGGTTGTATTCGCTGGATACCAGAGGGCG 

GAAGTGCAGCAGGGTTCAGCTCCGACCTCCGCGCCGGTGCTTTTTGCGGCTGCGCGGGCTTCCTGGAGTC 

CTGCTACCGCGTCCCCGCAGGACAGTGTGTCAGGCGGGCAGCTTGCCCCGCCGCCCCACCGGAGCGCGGA 

ATCTGGGCGTCCCCACCAGTGCGGGGAGCCGGAAGGAGGAGCCATAGCTTGGAGTAGGTTTGGCTTTGGT 

TGAAATAAGAATTTAGCCTGTATGTACTGCTTTAACTCCTGGAAGAATGACAGATGACAAAGATGTGCTT 

CGAGATGTGTGGTTTGGACGAATTCCAACTTGTTTCACGCTATATCAGGATGAGATAACTGAAAGGGAAG 

CAGAACCATACTATTTGCTTTTGCCAAGAGTAAGTTATTTGACGTTGGTAACTGACAAAGTGAAAAAGCA 

CTTTCAGAAGGTTATGAGACAAGAAGACATTAGTGAGATATGGTTTGAATATGAAGGCACACCACTGAAA 

TGGCATTATCCAATTGGTTTGCTATTTGATCTTCTTGCATCAAGTTCAGCTCTTCCTTGGAACATCACAG 

TACATTTTAAGAGTTTTCCAGAAAAAGACCTTCTGCACTGTCCATCTAAGGATGCAATTGAAGCTCATTT 

TATGTCATGTATGAAAGAAGCTGATGCTTTAAAACATAAAAGTCAAGTAATCAATGAAATGCAGAAAAAA 

GATCACAAGCAACTCTGGATGGGATTGCAAAATGACAGATTTGACCAGTTTTGGGCCATCAATCGGAAAC 

TCATGGAATATCCTGCAGAAGAAAATGGATTTCGTTATATCCCCTTTAGAATATATCAGACAACGACTGA 

AAGACCTTTCATTCAGAAGCTGTTTCGTCCTGTGGCTGCAGATGGACAGTTGCACACACTAGGAGATCTC 

CTCAAAGAAGTTTGTCCTTCTGCTATTGATCCTGAAGATGGGGAAAAAAAGAATCAAGTGATGATTCATG 

GAATTGAGCCAATGTTGGAAACACCTCTGCAGTGGCTGAGTGAACATCTGAGCTACCCGGATAATTTTCT 

TCATATTAGTATCATCCCACAGCCAACAGATTGAAGGATCAACTATTTGCCTGAACAGAATCATCCTTAA 

ATGGGATTTATCAGAGCATGTCACCCTTTTGCTTCAATCAGGTTTGGTGGAGGCAACCTGACCAGAAACA 

CTTCGCTGCTGCAAGCCAGACAGGAAAAAGATTCCATGTCAGATAAGGCAACTGGGCTGGTCTTACTTTG 

CATCACCTCTGCTTTCCTCCACTGCCATCATTAAACCTCAGCTGTGACATGAAAGACTTACCGGACCACT 

GAAGGTCTT CTG TAAAATATAATG AAGCTGAAAC CTTTGGCCTAAGAAGAAAATGG AAGTATGTG C CACT 

CGATTTGTATTTCTGATTAACAAATAAACAGGGGTATTTCCTAAGGTGACCATGGTTGAACTTTAGCTCA 

TGAAAGTGGAAACATTGGTTTAATTTTCAAGAGAATTAAGAAAGTAAAAGAGAAATTCTGTTATCAATAA 

CTTGCAAGTAATTTTTTGTAAAAGATTGAATTACAGTAAACCCATCTTTCCTTAACGAAAATTTCCTATG 

TTTACAGTCTGTCTATTGGTATGCAATCTTGTAACTTTGATAATGAACAGTGAGAGATTTTTAAATAAAG 

CCTCTAAATATGTTTTGTCATTTAATAACATACAGTTTTGTCACTTTTCAAGTACTTTCTGACTCACATA 

CAGTAGATCACTTTTTACTCTGTGTTACCATTTTGACTGGTCGTCATTGGCATGGGGTGGATATAGGGCA 

TAGGATTACTTGTCTCAGAAGCTGTCATAGAATTTCTTGCTGCCAATTAAAAAACCTGTGTTCTTTACAC 

ACTACACGTATAAATATTGTAACTGTTCATCTTTGTTGTTTTATC7VCTGTAAGCCTGTCAAATCATAGTA 

TCCTAAGCATCTGTAAATGCTAATTTTGCATTTTTGGAAAAACCCATTCCTTCCAAGCTAGTGTTTTTCA 

TTGGCTCCAGGTCTAATTTTTCACTGTGGTCCCTGGCAGCCAGTCTTTTGAAGTTTAAAGATTACCTGTC 

TCTTGACTGCAGTACCTTTTCTTTAATTTTTACCAAAAATATCCAGAGGTTACTGGAGTTCTTATTCAAT 

ATAAGGAAAGTTTGCTGCACTTTATTACCAAGCCTCTGGGATTTTACCAGTCAAACATATTTGTGCATTA 

CATTTCATTTCTTGTGAGCTAGCTGGCTGTCCATATTGAATGTTGACCCATTTGAGTACGCTAAAAGGCT 

TACAGTATCAGACACGATCATGGTTTTAGATCCCATAATAAAAATGRATGTTTTTCTTATAAAAAATTAT 

ACAAATGCTGAAGTGAGATTCTACTATTGTTCATTGCTTCCTTTTCTTTTTCCTTTTGCGATTTTCACTG 

ATTAATAGCACATTTCTTCACAAAATTAGATAAAGTTGGTCAAAGACCAGATATTCTGGAATGGAAATTG 

TAAAGCTTAATCAAAAAGAATAGCCAGTACAGCATACAATCTCAGAAACTTAGAAGCAAGTAGAAAATAA 

TTGGTTGATGTAAACGAAAGTGCCATTTTAGTAAAGGCAGGAAAAAAATAGCAATATTTGAGTTATGTAA 

GGATAAAAAATCCACTGACTTGTATTTTTGCACAAGAGGCTGGTCTGAATATGATTGTTCACATTAAGAG 

TGTTTATTCGTCGGTTCATTTTGGGGATTTTCCCCCTTGATGTTTTGACAGATTGAAGTGAGCTTTAGTG 

AGCAAAAGGATCAGAATGCAGGGAACACTAAGCTGTGATGAAGAAAGTGTGGTAAAAAGCCAGAGTAGTT 

TTATACAGACAAAACCAGTGTCAGGCCTTTGCAGTAGGCTTGAGTGAACTTCTGATCTAGATTTGAAAGT 

AAATTTTATGAAGACATTGCCCATTTTTACTTCCTCATTCATTATTGTACCAGCATCATAGCTTTATTAC 

TCTAATCCCAGGTAAGTCAAGCCTACAATGCCCTAGAGGAAGAGTAAAACCAGAAATTCATGCTGGCTTA 

AATAATCTATTTTTGTTTCTTTTCATTTGAATATTTAAATTTTATGGTTTATTAAAAAATTAAATAAAAA 

AGAAAAAAAAAAAAAAAAAAAA 
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GAATTCCGGGAAGCCAGACGGTTAACACAGACAAAGTGCTGCCGTGACACTCGGCCCTCCAGTGTTGCGG 
AGAGGCAAGAGCAGCGACCGCGCACCTGTCCGCCCGGAGCTGGGACGCGCGCCCGGGCGGCCGGACGAAG 
CGAGGAGGGACCGCCGAGGCTGCCCCCAAGTGTAACTCCAGCACTGTGAGGTTTCAGGGATTGGCAGAGG 
GGACCAAGGGGAC ATGAAAATGGACATGGAGGATGCGGATATGACTCTGTGGACAGAGGCTGAGTTTGAA 
GAGAAGTGTACATACATTGTGAACGACCACCCCTGGGATTCTGGTGCTGATGGCGGTACTTCGGTTCAGG 
CGGAGGCATCCTTACCAAGGAATCTGCTTTTCAAGTATGCCACCAACAGTGAAGAGGTTATTGGAGTGAT 
GAGTAAAGAATACATACCAAAGGGCACACGTTTTGGACCCCTAATAGGTGAAATCTACACCAATGACACA 
GTTCCTAAGAACGCCAACAGGAAATATTTTTGGAGGATCTATTCCAGAGGGGAGCTTCACCACTTCATTG 
ACGGCTTTAATGAAGAGAAAAGCAACTGGATGCGCTATGTGAATCCAGCACACTCTCCCCGGGAGCAAAA 
CCTGGCTGCGTGTCAGAACGGGATGAACATCTACTTCTACACCATTAAGCCCATCCCTGCCAACCAGGAA 
CTTCTTGTGTGGTATTGTCGGGACTTTGCAGAAAGGCTTCACTACCCTTATCCCGGAGAGCTGACAATGA 
TGAATCTCACACAAACACAGAGCAGTCTAAAGCAACCGAGCACTGAGAAAAATGAACTCTGCCCAAAGAA 
TGTCCCAAAGAGAGAGTACAGCGTGAAAGAAATCCTAAAATTGGACTCCAACCCCTCCAAAGGAAAGGAC 
CTCTACCGTTCTAACATTTCACCCCTCACATCAGAAAAGGACCTCGATGACTTTAGAAGACGTGGGAGCC 
CCGAAATGCCCTTCTACCCTCGGGTCGTTTACCCCATCCGGGCCCCTCTGCCAGAAGACTTTTTGAAAGC 
TTCCCTGGCCTACGGGATCGAGAGACCCACGTACATCACTCGCTCCCCCATTCCATCCTCCACCACTCCA 
AGCCCCTCTGCAAGAAGCAGCCCCGACCAAAGCCTCAAGAGCTCCAGCCCTCACAGCAGCCCTGGGAATA 
CGGTGTCCCCTGTGGGCCCCGGCTCTCAAGAGCACCGGGACTCCTACGCTTACTTGAACGCGTCCTACGG 
CACGGAAGGTTTGGGCTCCTACCCTGGCTACGCACCCCTGCCCCACCTCCCGCCAGCTTTCATCCCCTCG 
TACAACGCTCACTACCCCAAGTTCCTCTTGCCCCCCTACGGCATGAATTGTAATGGCCTGAGCGCTGTGA 
GCAGCATGAATGGCATCAACAACTTTGGCCTCTTCCCGAGGCTGTGCCCTGTCTACAGCAATCTCCTCGG 
TGGGGGCAGCCTGCCCCACCCCATGCTCAACCCCACTTCTCTCCCGAGCTCGCTGCCCTCAGATGGAGCC 
CGGAGGTTGCTCCAGCCGGAGCATCCCAGGGAGGTGCTTGTCCCGGCGCCCCACAGTGCCTTCTCCTTTA 
CCGGGGCCGCCGCCAGCATGAAGGACAAGGCCTGTAGCCCCACAAGCGGGTCTCCCACGGCGGGAACAGC 
CGCCACGGCAGAACATGTGGTGCAGCCCAAAGCTACCTCAGCAGCGATGGCAGCCCCCAGCAGCGACGAA 
GCCATGAATCTCATTAAAAACAAAAGAAACATGACCGGCTACAAGACCCTTCCCTACCCGCTGAAGAAGC 
AGAACGGCAAGATCAAGTACGAATGCAACGTTTGCGCCAAGACTTTCGGCCAGCTCTCCAATCTGAAGGT 
CCACCTGAGAGTGCACAGTGGAGAACGGCCTTTCAAATGTCAGACTTGCAACAAGGGCTTTACTCAGCTC 
GC CCACCTGCAGAAAC ACTAC CTGGTACACACGGGAGAAAAGCC ACATGAATG C CAGGTC TG C CACAAGA 
GATTTAGCAGCACCAGCAATCTCAAGACCCACCTGCGACTCCATTCTGGAGAGAAACCATACCAATGCAA 
GGTGTGCCCTGCCAAGTTCACCCAGTTTGTGCACCTGAAACTGCACAAGCGTCTGCACACCCGGGAGCGG 
CCCCACAAGTGCTCCCAGTGCCACAAGAACTACATCCATCTCTGTAGCCTCAAGGTTCACCTGAAAGGGA 
ACTGCGCTGCGGCCCCGGCGCCTGGGCTGCCCTTGGAAGATCTGACCCGAATCAATGAAGAAATCGAGAA 
GTTTGACATCAGTGACAATGCTGACCGGCTCGAGGACGTGGAGGATGACATCAGTGTGATCTCTGTAGTG 
GAGAAGGAAATTCTGGCCGTGGTCAGAAAAGAGAAAGAAGAAACTGGCCTGAAAGTGTCTTTGCAAAGAA 
ACATGGGGAATGGACTCCTCTCCTCAGGGTGCAGCCTTTATGAGTCATCAGATCTACCCCTCATGAAGTT 
GCCTCCCAGCAACCCACTACCTCTGGTACCTGTAAAGGTCAAACAAGAAACAGTTGAACCAATGGATCCT 
TAAGATTTTCAGAAAACACTTATTT 
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CGCCGCCTGTGCAGCCGCTGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCTGCC 

GCCCCGGCTGCCGCGCCGCGCCGCTGCCTCTGCCCCGGCCGCCCCCGCCGCCGCTGCCGCCGCCGGCCCG 

CAGCCAGCCAGGCGGGCGGCCCAGCCCGCCTGAGCCCGCAGCGGCTGCCGCCGCAGCGTCGGGTCGCTGG 

GTGCGCGGGCTACCGCGGACCGAGCGGACCCGAGTGGGCGACCAGGCGCTTGCCCGCCCAGTGCCACTGC 

CGCCGCTTCCTCGCCGGAGCACAGGACCAGACACCTCCAGCGCCCGCTGCTGCTGCCGATGCGGCCCGGA 

CACTTTTAGCTGGGCGGGAGGGCTGGAGAGCCGGGGGCCGCCGAGAACCGCCAGCGAGCTGTGCCGAGAG 

CCGCGCCGACCCGCTGCGATCAGGGACAGGCGCCCGCCCGCCGCCGCCGCCTGGCCGCT ATGGATCTATT 

CGACTTTTTCAGAGACTGGGACTTGGAGCAGCAGTGTCACTATGAACAAGACCGTAGTGCACTTAAAAAA 

AGGGAATGGGAGCGGAGGAATCAAGAAGTCCAGCAAGAAGACGATCTCTTTTCTTCAGGCTTTGATCTTT 

TTGGGGAGCCATACAAGGTAGCTGAATATACAAACAAAGGTGATGCACTTGCCAACCGAGTCCAGAACAC 

G CTTGGAAACTATG ATGAAATGAAGAATTTGCTAACTAAC C ATTCT AATC AGAAT C AC CTAGTGGGAATT 

CCAAAGAATTCTGTGCCCCAGAATCCCAACAACAAAAATGAACCAAGCTTTTTTCCAGAACAAAAGAACA 

GAATAATTCCACCTCACCAGGATAATACCCATCCTTCAGCACCAATGCCTCCACCTTCTGTTGTGATACT 

GAATTC7VA.CTCTAATACACAGCAACAGAAAATCAAAACCTGAGTGGTCACGTGATAGTCATAACCCTAGC 

ACTGTACTGGCAAGCCAGGCCAGTGGTCAGCCAAACAAGATGCAGACTTTGACACAGGACCAGTCTCAAG 

CCAAACTGGAAGACTTCTTTGTCTACCCAGCTGAACAGCCCCAGATTGGAGAAGTTGAAGAGTCAAACCC 

ATCTGCAAAGGAAGACAGTAACCCTAATTCTAGTGGAGAAGATGCTTTCAAAGAAATCTTTCAATCCAAT 

TCACCGGAAGAATCTGAATTCGCCGTGCAAGCGCCTGGGTCTCCCCTAGTGGCTTCCTCTTTATTAGCTC 

CTAGCAGTGGCCTTTCAGTTCAAAACTTCCCACCAGGGCTTTACTGCAAAACAAGCATGGGGCAGCAAAA 

GCCAACTGCATACGTCAGACCCATGGATGGCCAGGACCAGGCACCGGACATCTCACCAACACTGAAACCT 

TCAATTGAATTTGAGAACAGCTTTGGGJ^ATCTGTCATTTGGAACACTCTTGGATGGAAAACCCAGTGCAG 

CCAGTTCAAAGACTAAACTGCCAAAGTTCACCATCCTCCAAACAAGTGAAGTAAGCCTTCCCAGTGATCC 

AAGCTGTGTTGAAGAAATCTTGCGGGAGATGACCCATTCCTGGCCTACTCCTCTCACTTCCATGCATACT 

GCTGGACACTCTGAGCAGAGCACCTTTTCCATCCCAGGACAGGAATCGCAGCATCTGACCCCAGGATTCA 

CCTTACAAAAGTGGAATGACCCAAC CACCAGAGCTTCTACAAAGTC AGTGT CTTTC AAAT CGATGCTTGA 

GGATGAC CTGAAGCTG AGCAGTGATG AAGATGACCTTGAG CCTGTGAAGAC CTTGACCAC TCAGTGCACT 

GCCACTGAGCTCTACCAGGCTGTTGAAAAGGCAAAACCTAGGAATAATCCTGTGAACCCACCCTTGGCCA 

CTCCCCAGCCCCCACCTGCAGTGCAAGCCAGCGGGGGTTCTGGCAGCTCCAGCGAATCGGAGAGCAGCTC 

TGAGTCGGATTCAGACACTGAAAGTAGCACCACTGACAGCGAATCTAATGAGGCACCTCGTGTGGCAACT 

CCAGAGCCTGAGCCACC CTCAACCAACAAGTGGCAACTGGATAAATGGCTTAAC AAAGTGACATC CCAGA 

ACAAGTCTTTTATTTGTGGCCCAAATGAAACACCCATGGAGACTATTTCTCTGCCTCCTCCAATCATCCA 

ACCAATGGAAGTC CAGATGAAAGTGAAGACG AATGC CAGTCAGGTCCCAGCTGAAC CCAAAG AAAGG C CT 

CTCCTCAGTCTCATTAGGGAGAAAGCCCGTCCACGGCCCACTCAGAAAATTCCAGAAACAAAGGCTTTGA 

AGCATAAGTTGTCAACAACTAGTGAGACAGTGTCTCAAAGGACAATTGGGAAAAAACAGCCCAAAAAAGT 

TGAGAAGAACAC CAGCACTGACGAGTTTACCTGGC C CAAAC C AAATATTAC CAGC AGCACTCCCAAAGAA 

AAAGAAAGTGTGGAGCTTCATGACCCACCAAGAGGCCGCAACAAAGCCACTGCCCACAAACCAGCCCCTA 

GGAAAGAACCAAGACCTAACATCCCTTTGGCTCCCGAGAAGAAGAAGTACAGAGGGCCTGGCAAGATTGT 

GCCAAAGTCTCGGGAATTCATTGAAACAGATTCATCTACATCTGACTCCAACACAGATCAGGAAGAGACC 

CTGGAAATCAAAGTCCTGCCTCCGTGCATTATTTCTGGAGGTAATACTGCCAAATCCAAGGAAATCTGTG 

GTGCCAGCCTGACCCTCAGCACCTTAATGAGTAGCAGTGGCAGCAACAACAACTTATCCATCAGTAATGA 

AGAGCCAACATTTTCACCTATTCCTGTCATGCAAACTGAAATCCTGTCCCCTCTGCGAGATCATGAGAAC 

CTGAAAAACCTCTGGGTGAAGATTGACCTTGACTTACTCTCTAGAGTACCTGGCCACAGCTCACTCCATG 

CAGCACCTGCCAAGCCAGACCACAAGGAGACTGCCACAAAACCCAAGCGTCAGACAGCTGTCACAGCTGT 

GGAGAAACCAGCCCCTAAGGGCAAACGTAAGCACAAGCCAATAGAAGTTGCAGAGAAGATCCCTGAGAAG 

AAGCAGCGCCTGGAGGAGGCCACAACTATCTGCTTGCTCCCTCCTTGCATCTCACCAGCCCCACCCCACA 

AGCCTCCCAACAOTAGAGAAAATAATTCATCCAGGAGAGCAAATAGAAGAAAGGAAGAAAAACTATTTCC 

TCCTCCACTTTCCCCACTGCCAGAGGACCCTCCACGCCGCAGAAATGTCAGTGGCAATAATGGTCCCTTT 

GGTCAAGACAAAAACATCGCCATGACTGGACAAATCACATCTACCAAACCTAAGAGAACTGAAGGCAAAT 

TCTGTGCTACTTTCAAAGGGATATCGGTAAATGAGGGAGACACTCCAAAAAAGGCATCCTCTGCCACCAT 

CACTGTCACCAATACTGCTATTGCCACTGCTACTGTCACTGCTACTGCCATTGTCACCACCACTGTCACA 
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GCTACTGCCACCGCCACGGCCACCACCACAACTACTACCACTACCATTTCCACCATCACCTCTACCATCA 
CTACTGGCCTCATGGATAGCAGTCACCTGGAGATGACGTCCTGGGCGGCTCTGCCCCTTCTATCCAGCAG 
CAGCACTAATGTCCGGAGACCCAAGCTCACTTTTGATGACTCGGTTCACAATGCTGATTATTACATGCAA 
GAAGCTAAGAAGCTGAAGCACAAAGCTGATGCACTGTTCGAGAAATTTGGCAAAGCTGTGAATTATGCTG 
ATGCCGCCCTCTCCTTCACTGAATGTGGCAATGCCATGGAACGCGACCCTCTGGAAGCAAAGTCCCCATA 
CACCATGTACTCTGAGACTGTGGAGCTCCTCAGGTATGCAATGAGGCTGAAGAACTTTGCAAGTCCCTTG 
GCTTCGGATGGGGACAAAAAGCTAGCAGTACTATGCTACCGATGTTTATCACTCCTCTATTTGAGAATGT 
TTAAGCTGAAGAAGGACCATGCTATGAAGTACTCCAGATCACTGATGGAATATTTTAAGCAAAATGCTTC 
AAAAGTCGCACAGATACCCTCTCCATGGGTAAGCAATGGAAAGAACACTCCATCCCCAGTGTCTCTCAAC 
AACGTCTCCCCCATCAACGCAATGGGGAACTGTAACAATGGCCCAGTCACCATTCCCCAGCGCATTCACC 
ACATGGCTGCCAGCCACGTCAACATCACTAGCAATGTGTTACGGGGCTATGAACACTGGGATATGGCCGA 
CAAACTGACAAGAGAAAACAAAGAATTCTTTGGTGATCTGGACACGCTGATGGGGCCTCTGACCCAGCAC 
AGCAGCATGACCAATCTTGTCCGCTACGTTCGCCAAGGACTGTGTTGGCTGCGCATCGATGCCCACTTGT 
TGTAGTGGGTGTTCTCAGATCTCTAGCATCACGACCCATCACTCTACCTCTACCAGCGCACTGATGGTCA 
CTGGTGGAACTCCACTCACTGGGGAACGTTCTCTTTGGTTATGTTTGTTTTTATGCTTCTTTTGTTATCT 
GTAAAAAACAGAAGTCATTGTAAGTTGACACTACAACTTAAGGGCAGTGTACGTTTTATTACTTAGTCAT 
TTTTTTTCTTTTAGCATTTGATATGCATTTCTCAGATTCCACCATCTTTTTGTGCTTTATGGAATGACAG 
TCCCTACAATATTGTTTTAAGCCCACACTACCCAAAACAAAGAATGGGAAGCACTTGTGATAAAGACAGG 
CTCCTGAGAAATGCAACAAGTGGTCTTACATATACATGAGAACTTAGACACAAGGGACCATCCCCCAAAC 
TCTACTCTTATACCCAGAAAAGAACATATTTCAGAATCTGTCAAACTTTTGTGTATCCCACAGATTCAAT 
CTTCAGGTGAGAATTTTCATTGTCAAAACCCACTGGTTAGATGTTGTAGCAACATCATAAAATCAAGAGT 
ATCAAGAAAATAAATGAGCATAGCAATGCTACTCTTAAAAAGATGCTATGCCACACAACCAGAGGACTTT 
CTTGTTAGCATCCCTTTCCTGATTCCCTATTTTGTTAATTTTAATGATAAGAAGAAAGGGTGACATTTAT 
TTTGACAAGTTTTAGGCATCAGCTGGCATCAGTGTTTTTCAACTCCATTATTTGAAGTGTAAATCCTCAC 
CTGGGGTTCTCTGTGTGCAAAGCTGTCCTTTTGAAGAACAGTTTGGTTGATGCATGCCTTAGTAGCCAAA 
ATGCTACACTCTAGACTTACAAGTGGGAGTTAAGAGAGGTCTGGAAAGTGTC CAACAAGGAATTC AC AC C 
TCTGCCTCCTTTGCAACAACAACATTTACACAGTTGGTAAGTGGGTCCATAACTGGCAGGATTTTTAAAT 
TGTATTTTGCTCAAATCTATGGGAACAAAAGTCAAGGTATCACTACCTAGAAGTAATGATATACAGTTTT 
CTTCCTAGTGGCTTGAAAATCTGGACTTCCTCAATTATTATTCACATTTTCTCTCTTATAGGTTTTCTGT 
TTTCTACTTTCTTTTTTCTCTTATCTGTGTTTCCCTTTCCTTTGTTTGGCTCATTAACTTTTGACTGAAT 
TACAATTACTCCTTTTATTAAAGTCCATATTATTGTGAATCATTTCCATGAAAATTTCTAAGAAAACTCC 
AAACTCTCTAAATAGTAGCTAACTTTTATTTTTTTAAAATGAGTCGTGGGGTAGTGCTTCACCTTGAGAT 
GCTTTGAAAGAGCCCTAAACATTGGGAACCATTCACCTAATTTGGAGACATTTCTCACTGGTTGTGACTA 
CCCCCTTATGATC CTT CAC ATTCATTTTATGTCC CTAAACATCACAATGTAAATATCATTTTTGATGTTC 
CAGCTCACCAGAAGATTCTTACACTTGGGGTAAACACTATCCATGCATTACTTACTGGTAATTACCTGCT 
GGTATATAATTCCATGTAGCCTTTAATATGCTGGGTTATCAAATTCTGTTCACTGAGTTATGACCAGATA 
AATAATAGATATGCACATGAAAGATGCAAACTTGTGTGATTATTAAAGCCAGCCATGCAGGTCCATGATA 
GAAACAGCAGGTGATGACTCTGCACTCTCATTGTCAAGGT^^ 

ACTTGAGCTGTGCTCTGGTCATCTTTGAGTTTAAGGCCTTTTGTTGTATAAGGCTGTGGAAGTTGTACTC 
CAATGGCTGAAGC CATGTTGTTAATATGGCTGATGGGAGCATCCCTGCAGCTGAAC CCAGCACTTTTTAT 
GCTCCCACTGTGGTTGAGCTTTATGTTTACAGTCTCAGCAACAACACT^ 

TGAAACCTGAAAGAATCTTTTCTGAGCCTCTTAAAAGAGGAAAATGATGATAACATTAAAGACTCTGAAC 
ACCCAAGGTTGGTGTCACATATAAAAATTAAGCTGATGACTTTGCAGTGACTCAAGTTGTCTCTTTATCA 
TGGTTTACCAGGTAGAGTGCCTGGCTATTACTATATAATGAAGCCCACTGGCTTGACTTGTAAGTTCAAC 
CTAAACCACAATCCTAGACCATCATGGATTTAGGAGTAGATTCTTCTTGAAATCCCACATCCAGAAACTA 
GACATTAGAATGTTGAGGCAGTTTCCCAGAGAAACAAGCATATTGCCTCATGGATGAAAGACTTGTAGTT 
CTAGTTTCAGTGACTTGTTATATCTACTTACATACAACAGGGAGGCAAGAGGATTCTCTGTCATCTCTGG 
TGACTGAGTGTAAAATATGTGCCAAGTCTGCAGCACAGTGACCAAATCTGACAATCGAGCTCTGGATCAC 
CACTTGATTATGTAGTAGACTCATTTATAAAGCAGCTTAGGAACTAATTAAACATGGAGGATGAATTACC 
TTCCTATCCCTTGAGATAAGACATCTTTCAGTTTCATGATTAAGGATTGTTGCTGTTTTATAGTTACTCT 
GTTCATCACAGTGTAAATGGTGATGCGTGTCGTAGGTGTGCAGCTATTTGAGGGACTAAGGGATGGAGAT 
ATTCTGTCAAATGAATCTCTTCAGTATACCAGTTTGTGGGAGGGATATGAGACATGTGGATGGCAGTGAG 
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AGATCGTGCCTCTAGATCTTGATGGAGGCTTGGTGAGACACACTTAAATAAGCACGTGGAGGTTAGAATA 

GAGGGCAGAGTAAAAGGAAGCTCCATCTGAGCAAGTACACCAAATGATCTCAGCCCTGCAACTTGACCCA 

GGTAGGGCCACCACTACGCCTTCACTTGTCACCCAAGCTCCAACCACAGAGAGTTTGACAAGTTTGTGTT 

ATGATGTTGGCTTGGCTTTGTATTTTTAATTAACTTTGGATTTTTAGTGGTTTTGTCATATAACTGTCTG 

AGTTTGGTAGGTAGGATTACTTTGAAAAGGGTTTACTAGTGTGGTCCTCCGGGTAGAATTTAGCTGTAAC 

ATGTTGTTAGCCAGCCTGTAGACTGTTAATTACTTAATAATCTCATTGGGAAAATACTAGTAGTTTTATA 

TTTGGATGACATAATTGGAAAAAGCAGATTAGCTGCTACTACTTTTAAAAGACTTAAGGTCGGGATGCCT 

TTTTTTCCATGTAAGGAAATGAAAAGACCCAAAATCTTCAGGCAAAAAGCAAGTTGCAAAATTAGAAACC 

ATTGGCTAAAAATGTGTTTTGTTGAGTTTCCAAATGGATGAATTTTCATTTGGACATTACATCACTAAAT 

TCATTAGATTTTGTCTGCATTGGAAAGATACTCTTCTAGCATATCTTTCCCAAAGATATCTAATTTGGAT 

TCTGTTTCATGCAAATTTGCATCCCGGAGGTTGAAGTTGGAGTTTGAGGTTGGAAAATATCTTTGAAGGC 

AGAATCAGTTGAGTTGTGAGGGTGAAGCCTCACATACTTCTCAACAGACATGATAAAATTCACCTGCATG 

AGTTGGCAGGTGGGAGAACCAAACTGGATCACTGGGTAAGACTACTCAGTAAAGCAATGAACTGCTTGCT 

TAGAGAAGCATCACTATCCCCATTGAGAAAAATGTGTGGCAAGATGATACAGCTACACAGTATCAAATGA 

ATGGGTCAATTC AGCAC C CCCAAATTTAATT CTGTGGGGAAAAATTATTGAGC C AGTTGT CAGTGTTCTG 

TTACATGACTGGCAGACTAAATTCTTCATCGTTGTTGTTATTGTTGTTGTTGTTTCTCATTTTCACTCGC 

ACGGCCTTATTCTCATAATTAAAATCTAATTCATTTTCTCTTTAGTGTTAGTAGACTCCAACAACAGAAG 

TGGCATCTGTGTATTCATAATC AGCATTTAC CCTGGCAGGAGACTAAT CAG ATAGG C CGGTCTCAGACAT 

TAATCCTACCATCTGATATTTTTGGTGAAGGAAAAAGTATTAATTCTCTTTCCATCCTCCTCCTCAGAAA 

TATAGAAGCCCTCTTTACCAAAATCATCACATTTTACTCTGTAATCTACCAGCTAAAAGAAAATTGCATT 

GAAGCCCCACAAAGCCAGATTGCAGTTCTTGCCCCTTTTTGCGTCTGACATGAGATGTTAAAGAATTATT 

CATTGTGCTCAC ATTGGGTTAGGGGACACTGAACTGCTTTTTAGAT C CATGAT CAGTCAT C ATTCTTCTA 

AGAGATTGGAGCTTTGCTGTTTCATTAACTGTGCAGTGTAGACTAATGGTGTTTAATAAAAATCATTCAA 

AATTTCAAACTCTTTTGCCAGTGACCTCAATTTTGTTGGCTCTGTGATTTGTATCAGACTTTGAGGAGGG 

AAGGGGGAAGTGAAGGAAGCCTACGTCCAGGCCCCTGACAGGATGCTGCAGTAGCAAGCTCAAGCTCGCC 

TGCCTGCCAGCAGTTGCTGGTGAGCAGCAGCATGCAGACCAGCTGTGGGAAGCCTCCTGAAGAATGCCCC 

AGCTGATGCTTTCAGCTGGGAATAGTTTGTTCCTATTGGGGAACTCATTGTTCTCCAGTCTCTGCAGCAG 

GAAGCCAGCTGTCATATTCGGAGGGAATTTCAGATGCTTTACCTTTTTGGTTTTGTCCTGCATCACTCAT 

GTGGCTACGAAAGTGTCTCTGAGAATAGAGCCCAATGTGGTGACAATGGGTAGTCAAATGCACCCCAGAT 

GCTCAAGCCCTGTTGTGGTTCTGCAGTGTTTATGAAATTGGGAGGAAGGAGACCCTGGACAGTAAGCAAA 

ATTGGAGACACTCCAACGAGGCTAAGTTAATGCCGTGTTGCCCAGAACAAGATCTAGCTTCTCATTTGGT 

CAGCCTAGCATGCAACCAGTGGTGTGCTGGTAAAATGTTTAACAACCAGCTCGCTGAGAATAGAAAGCAC 

CTGGTTTGCACCATTTGCCAATTTCCATGGCATAAATACTACCACTTTAGATGATTTTAAGCTACCAACT 

GTGATGTCACTGAACACATGGTTGGAAAG AGATGCACGC AGTTGGCTCTTG CAAG C CTGGGCAAAAATGC 

TTCAACACGCCACTGGATGCAGCCAGTCAGAGGGTTCATATTTAATATATGTGTTCATGTGGACACACAC 

AGACACACAC^CACAAACTCACCCTTAC^CAC^^ 

ATGAATCAATGTGTGAATGTAGAAAGCTTATGATAAGGCCCTAGAGGTATGGGTTGCCCTGGAAGCCTAG 
GTTTTAAGCAGGAGAATAGCTGAGAAGAATGAAGCCCTCCTGAGCTGAAAGGAGAGATGGATCAATGGAG 
ATGGTTCCATCATCTCCTTCCATATCTCACAGGTAAAATGGGCACTCAGAAAACCCTCACGATTGATTTT 
TTAAAAAGATAAGTGAGTGTTTTTTATTTTATTATTATTGTCATCATTATTTTGATTTACAAATGCTATT 
TGTAACTTTTACATGTAACTAGGATAAAGTATTTACGGGAACTCTATGGAGAATAGCACAATCCAGAATT 
TACTGTGTTTTTCTTTTATGTGACGTGGAAACTCAGTAATTCTCCCACCTTCACATTGTTGTTCATAAGA 
ATTTTACTTTAGTTATTAGGGAATCTAAGTTTTTTGTTAACATTTGTTTTTAGTTAAAAGTATCTACTTA 
CTGTTTTAGCTCTGAACTCAAACCAGAATATCTCTGTATCAATTGCATGACTATTCAGAAACAATAATCC 
AAACCAAAATAATTCTTTTTCCACCCAGTACGAAGAAAACTAAGCTCAGTAACAAGAAGGCATAAACTAA 
AGTATATAATGAGGCTTTCATTAAATACACACACACACACACTCACACACACACACATACACTTTTTAAA 
TTTTTAAATTAGGCCTCCACACATAAATCATTT^ 

CTGGTCCTGTGCATCTTCTGCAGTTAATAAGAGGTTTGTATCTGGAAAGATGGAAGAACTTGTTCTAAAA 
TCTTATTTTTCAAAAAAAT^TTTCCATTTTCTCTCTGGGCCTGTATCCATGGTTGAATGTTAGCCCTGGA 
GGAGATCCATGTCTTACTCGCTCTTTCTGGCCCTTCTGTCTTTTGCCTCTGCZAATTCTTTTTGTAGCT^ 
CACGATAGCAGGGACTGGGGGTCTATCCTTTCATGGTATTGCTACAATATTTGTCCTTACTGGAAAATGG 
TAACATCCGGGTCTGATTTAATTGGCATTACACTTACACAGGGACTCTGAGCACCCCCGTCACCACACCA 



FIGURE 26.3 



WO 99/67395 



PCT/FR99/01513 



64/64 

GACAGTGGACCAGTTTTCACAGCTACAAAGAGCTAGAAATGTGTTTAACATCATCC AGTG CATC CC CTAA 

TTCAAAACCATCCTCACTAATCAATCATATTCACCCATAAATATTACAAATGAGATTGATTCCATCTCAA 

GACAATTTGTCAAATACTTAATTTTCTTCCTGGATGATTCTACTTACTGGATATTTTAGAAAGAGAAATG 

TCTGAGATAAAATCCCTCACATTTACTCAATATAACAAATTACTGTTTCTACTCCTATTCTGAGTAGTGC 

TTCTGAAGATTGTTTGCTGTAGTGTTGTCTTTGATAAAATGAATGTCAGTAGTGAGCCTTTTAGAGATAC 

CATGCTC AGACATCCTCTTTGGGATCAGAAGATAC CTAAAATTCTC C CCTTTTG CCCACTTGGTTAGATG 

AGTGATATATTCTTTGGATCCTGCAAAGAAGAGATTGGTTTCTTTTCTTTTCTGGTGGTGGTAGTGGTTG 

TATCTGTGGCTGTGATGGTTGTTGTTACTTGTCTCTCTCTCTCTCTGGCTCTGGCTTTTGCTTTCCTGCT 

AGTGTTCTTTCT CTTTC CAAACAAATAGTTAAATTAAACGTGAG CTTCTGAATTGTACTTGTTCATACTT 

TCAAAACATAACAGATTAATAAAAATAGATGTGTCCTGATTTAAAACATGCCCCCTGGAAAGGCATGCTG 

TATTATGAAATCGTGATAATATAACTGCATTATTACATGGCAGTATAAATATTAGTCTGTTGAATTCATT 

TGTCCAATTGTATAACTTTGTGGAGCAGTGTTTTGACCTTTGATACATAATTCTGGAGCAAGTGGAGTGG 

TTGCAGGCAGATGAGACAGTGTTATATCAGGATTTTTCAATCAACTTTAGTTGGAGGCCTGGCAATTACA 

AACATCTTCAGATGTTTCTGTAACCATTATAAATATGAAAAAAACCTCTTCAAAAAATTTCCCATAGTAC 

TTCAGTCAAGACTTTTTAGGTTTATCTTTTTTTTTTCATTTCTCCTTTTCCTTTTCCATTATTTTTCGAT 

GGGGGGGTTGTTATCATTGACTGAAGAAATATTTTGATTGCAATGGTCTCTCTCTCTCTCCCCCTCTCTC 

TCTCTCTCCTCTATTCTTTCCTCCTTCCCTCTGTCCATCACCCCTCATTAAAATATTGAAATCTGGAGTC 

TTTGATAAATCTGCATTAGACCAGGCTATATGCTAGGAATGAAATCTGGGCAAATATCGATGGGTTTTCA 

AAGAATG CTC CATGTTC ATTGGGCC CTTTCACACC CCACAGTGATAAATGAAAAGG ATAG AGGTAGTTTT 

TTCAAAAGAG CACTTTAATAATATCCTCTGAGACCTAATGCAGTTTAACAAATGACTCC AC CTATTTTTC 

CAGTAGGTAAATTGACTGAGACTTGCAAAATACCCCTGAGAGTTGTCAGGGGTGTCTTCTGCCTGGTCTA 

TAGCGTGTGTGTTTGCTTTGTATCTAACAGGCACATTCACGTCTCGTGTACTCATATGAAGTATTTCCTA 

ACATTCCCATTAGCCTGTATATAAGAATCAGAAAGATAATCCCAACATGTTGTAAATGAAGATGTGACTC 

TATAACCTTTCTCTTCTTCCTGGAAAAAAAAGGACATTTTCATGCATATTTTAAACAGAAATTTTGTATA 

TTTAAGTGTCATAGAAAATATTTATTGAGTAACTGGGACACAAATGGGAATTTAATTGTCATCATATGCT 

TTGTGTGTGGGGATGCTTACCAACACCATGTCGCTGGACCATTGTGGCAAGCCATAACTGCACAAAGAGT 

ACACATCGTCAGTGTGTGTGTGTGTGTGTGTGTGCGCGCACGCACGTGCGTGTGTGTGTCCCTGCATGTG 

CAACATGTCTAGCTTGCTGTCCTTCATGGGATTTTAGCTTTCCCTTCTTGAAAAACATTATTTTACAGTT 

CCAGGAGGCCCTGGTTACATTACTATATGAAGGCAGTGATTTGAAATGAAAATTCCTTTCCTCTTGGAAG 

CTTTGGTCATAATATCATGGTTCAATTAAACGGATTCCACCGGACTTTGTGATGAAAAAGGCTCTGTTAA 

AATCCAATTGAGTTTCCAAGAGGAAATTGTAGTAGGTCAAGATGCATGAGAGGGAAGATGGAGGCCACCT 

CAGCTGGAGAACATGAGCTGAGTTGAGCCCTCAGTGTTGAAGTTGACTTGCTCCAAGCTGCAGTCTAAAA 

CCCTGGGGCCCGTGCCTGGCCTATGCTCCCTCCCAAGTAAGTAGAGGAGCAGAACCATCAGGAACAGCCT 

GCCTGGCTCCTATGAAGAAAACTTCCTGACGTCCTGTCCCCAAAGGAAGACCCTTTCCCCAAGGGCACCC 

CAGGTGGCCATTAAATTGTGATGATCATTCAGAAAGTGCCCC CTTGGCTTTATGAGAATC CAATTAGTCT 

TCTGAACCACCTTTTCTTGGGTGC^GATTTCCAACATTCATGCTC^TTGCAGATCCACCAACTGTCACTG 

TTCTTAACAAGC ATGCT CGTCTTGTCAGAATTTCAGTAAGTTC C AATTTC CTGT AC AG AC C AGGG TAAAC 

TGTTCTAAAATCAATCAATTAATGAAATGTTATCTGGTTTTTAAAAGCTGGTTTCATGTGCTTTATGTGT 

ATAAAACTATATCTGCCTGTGTGGCTTTGCATTTCAAATGTGTGGCGCACAAGCGTTTTGTTGGTGCTTT 

GTTCTCAGTACAGTAACTCTGTGTACAAACATTTTAATGTGGTTTTGTTGTTTTCCAACAAGATGTCTCT 

GTAAT^AATGATATTGGCTGAGCTGGTGCGTTGGTTTCTCTCATAGAGGCATTAACTATACTGCCAATGCA 

TTGAATTATTTAAAAATGCAAAATAAAATTTTTATGAAAATCTCA 
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<210> 1 
<211> 2599 
<212> ADN 

<213> Homo sapiens 



<400> 1 

atcccctgcc 

gaagactggc 

tctgggtaga 

aagaggtaat 

tacagagtga 

taggtatacg 

aaatgaatga 

ggcctgctct 

ttagcccata 

caagacagcc 

aacattacaa 

ggtattagtc 

ctacccagtc 

acatcacact 

cgctagctat 

aggaaagtaa 

tgttctttta 

ctccccttac 

gtataggagt 

ctgctatcac 

gattaatcct 

aactggtatg 

agtaatctcc 

ctcaaaacta 

cctcactggg 

cctgaacttc 

agaaataaac 

tacctcaaac 



ttaatcgcca 
aactgatttt 
tactttcacg 
aaaggcacta 
caatagccct 
atatcactta 
aacactcaaa 
gttgcctata 
cgaaatgctg 
aacttagttg 
ggaacctatc 
aagtcccttc 
attttatcta 
tgagtcaaat 
tcctgtgaac 
ctaaaatcat 
ccctctttca 
caagagtttc 
ctttctaagg 
tctgccactc 
agttgtcctg 
tctgatgggg 
caactcaccc 
catgaaaccc 
ctccatgagg 
aggccatatg 
accacttccg 
ctcacctgtg 



agctccttca 
acccacaagc 
ggttgggcag 
gttcatgaaa 
gctttccagg 
. cactgcgcct 
ggacatctaa 
gccttaaaaa 
tatggaaggc 
cagacatcac 
cctgagaaga 
cctctaattc 
ccccaactgc 
cctggatact 
ctctagagga 
aaatccccat 
ctctcactgc 
tatggagaat 
gaacccccac 
tttgcatgca 
gaggacttgg 
gtggagttca 
gggtacatgg 
tccgtaccca 
tctcggccca 
tttcaatccc 
ttttagtagg 
taaaatttag 



ggagaacaaa 
ccaaacctca 
aggccttccc 
taattcccag 
ccacagtaac 
gaaggccaca 
aaaagcaaac 
gaatctgcaa 
ccttcataac 
ctccttagcc 
gggaaaagaa 
cccatcccta 
ggttaaagtg 
gccaaaggaa 
tttgcgcctg 
ggccctccct 
accccctcca 
gcagcgtccc 
cttcactgcc 
tgcaaatact 
agtcactgtc 
agatcaggca 
cacctctagc 
tactcgcctg 
aaaccctact 
tgtacctgaa 
acctcttgtt 
caatactaca 



gaacaggcca 
gggatttcag 
ctgtaggaca 
attcggactt 
ccagggagta 
grcctcaggg 
ccaggaaacc 
ctttccccaa 
caatgacctt 
aaatatcaac 
ctattccacc 
gatacatcct 
gctggagtgg 
cctgaaaatc 
ctcttcaaac 
tatcatattt 
tgccgctgta 
ggaaatattg 
cacacccata 
cattattgga 
tgttggactt 
agagaaaaac 
ccctacaaag 
gtaagcctat 
aactgttgga 
caatggaaca 
tccaatctgg 
tacacaacca 



ttaccctgga 
tatctactag 
gaaaaggccc 
ccccgaggct 
tcccaggcgt 
aaggtcgaga 
cacctcacat 
aaagcaggac 
gtgcttgacc 
aagttcttaa 
cttgtgacat 
gggaaggacc 
agtcttggat 
caggagacaa 
aacaaccagg 
ttctctttac 
tgaccagtag 
atgccccatc 
tgccccgcaa 
caggaaaaat 
acttcaccca 
atgtaaaaga 
gactagatct 
ttaataccac 
tatgcctccc 
acttcagcac 
aaataaccca 
actcccaatg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 
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catcaggtgg gtaactcctc ccacacaaat 
ctgtggtacc tcagcctatc gttgtttgaa 
attcttagtg ccccctatga ccatctacac 
taagccccgc aacaaaagag tacccattct 
tgcactaggt actggcattg gcggtatcac 
tcaagaacta aatggggaca tggaacgggt 
acttaactcc ctagcagcag tagtccttca 
tgaaagaggg ggaacctgtt tatttttagg 
cggaatcgtc actgagaaag ttaaagaaat 
gcttcgaaac actggaccct ggggcctcct 
cttaggacct ctagcagcta taatattgct 
ccttgttaac tttgtctctt ccagaatcga 
gcagtccaag actaagatct accgcagacc 
tgttaatgac atcaaaggca cccctcctga 
ccccaattca gcaggaagca gttagagcgg 
ttttcctgtt gagatgggg 



2 

agtctgccta ccczcaggaa tattttttg- 1740 
tggctcttca ga at era eg- gcttcctctc 1300 
tgaacaaga: ttaiacagi: atgtcatatc I860 
tccttttgtt ataggagcag gagtgerage 1920 
aacctctact cagtuCtac: acaaactatc 1980 
cgccgactcc czggzcaccz tgeaagatea 2040 
aaatcgaaga gcttnagact tgctaaccgc 2100 
ggaagaatgc tgttantatg ttaatcaatc 2160 
tcgagatcga atacaacgia gagcagagga 2220 
cagecaatgg atgccctgca ttctcccctt 2280 
actcctcttt ggaccctgna tctttaacci 2340 
agctgtaaaa ciacaaargg ageccaagar 2400 
cctggaccgg cccgctagcc cacgarctga 2460 
ggaaatctca gctgcacaac ctctactacg 2520 
tctcggccaa cctccccaac agcacrtagg 2580 

2599 



<210> 2 
<211> 1326 
<212> ADN 

<213> Homo sapiens 
<400> 2 

gccgcctggc actcctgagg gaagtataaa 
ttgtagaaaa ggcaaatgga gtgaagtgcc 
caactcacaa ttatgtaaaa agtgtgattt 
tccctatccc agcatccccg actccttccc 
tggtccaaaa ggagatagac aaaagggtaa 
aattatgacc cctccaagca gtgggaggaa 
ctttttctct cccagactta aagcaaataa 
ctgatggcta tattgatgtt ttacaagggt 
atataatgtc actgetaaat cagacactaa 
cagectgaga gtttggcgat ctctggtatc 
aggaaagaga atgattcccc acaggccagc 
acacagaatc agaacatgga gattggtgct 
gactaaggaa aactaggaag aagtctatga 
gaagggaaga aaatcctact gectttctgg 
cctctctgtc acctgactct tetgaaggee 
agtcagctgc agacattaga aaaaaacttc 
tagaaaccct attgaacttg gcaacctcgg 
eggaacagga caaaegggat taaaaaaaag 
gtggactttg gaggctctgg aaaagggaaa 
tgcttccagt geggtctaca aggacacttt 
ccccctcgtc catgcccctt atttcaaggg 
caaaggtcct ctgagtcaga agccactaac 
ctgggg 



ttataacacc atcttacagc tagacctctt 60 
ataagtacaa acttrctttt cattaagaga 120 
atgccctaca ggaagectte agagtctacc 180 
caactaataa ggacccccct tcaacccaaa 240 
acagtgaacc aaagagtgcc aatattcccc 300 
gagaattegg cccagccaga gtgcatgtgc 360 
aaacagactt aggtaaattc tcagataacc 420 
taggacaatt ctttgatctg acatggagag 480 
ccccaaatga gagaagtgee accataactg 540 
tcagtcaggt caatgatagg atgacaacag 600 
aggcagttcc cagtctagac cctcattggg 660 
gcagacattt gctaactrgn gtgctagaag 720 
attactcaat gatgtccacc ataacacagg 780 
agagactaag ggaggcattg aggaagegtg 840 
aactaatctt aaagcgtaag tttatcactc 900 
aaaagtctgc cgtaggcccg gagcaaaact 960 
ttttttataa tagagatcag gaggagcagg 1020 
gccaccgctt tagtcatgac cctcaggcaa 1080 
agctgggcaa attgaatgee taatagggct 1140 
aaaaaagatt gtccaagtag aagtaagccg 1200 
aatcactgga aggcccactg ccccagggga 1260 
cagatgatcc agcagcagga ctgagggtgc 1320 

1326 



<210> 3 
<211> 10499 
<212> ADN 

<213> Homo sapiens 
<400> 3 

ccctggggcg ggcttccttt ctgggatgag 
ttgcaactga gagacaggac tagctggatt 
gctgggaagg tgaccacgtc cacctttaaa 



ggcaaaaege ctggagatac agcaattatc 60 
tcctaggccg actaagaatc cctaagccta 120 
caeggggett gcaacttagc tcacacctga 180 
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ccaatcagag agctcactaa aatgctaatt 
atcatciatt gcctgagagc acagcaggag 
tcgagctggc aacagcagcc cccctttggg 
tgctatttca ctctattaaa tcttgcaact 
cgagctgagc ttttgctcac cgtccaccac 
tgactcccat ccctctggat cctgcagggt 
ccattgccgc tcccaattgg gctaaaggct 
ggtttgttct aattgagctg aacactagtc 
acggcttcta atagaactat aacacttacc 
cgtgaggcca agaactccag gtcagagaat 
tgctaccatc ttggaagtgg ttcaccacca 
ggtaacattt tggcaaccac gaacggacat 
cacttgctat tctgtcctat ccttccttag 
ccagttaaaa acgattagtg tggccaccgg 
gaagggcttt ctaacaaccc ccaacccttc 
gcttccactt tcagttttct tggggaagcc 
cctgaactcc cggcagtagc cggttgagat 
ccatgcatgc acccctatct ttccttctga 
tcttcaaagt gtagccccaa aattctcctt 
ctcctaggta ctattggttc agacttccat 
tctaaggaag ctctgcgctg cgtccttagg 
cctggtgtcc ctcccaattt aggcatacag 
ctccccacca cccttgccag ggccccaagt 
aggagagaga gagaaatgga ggagaaagag 
gagagacaga agagagagag agacaaagag 
gagaaagaaa tagtaaaaaa cagtgtgccc 
acctgtactt gataattgaa ggtcttctct 
ggtcagtgta aataagagca taggccgaaa 
cctatcaaaa atccttaacc cagtaacccg 
gcaactgctt tgctaaaagt agaaaagtaa 
ctcacctgtt cagaattatt ctaataaaaa 
tcttaaagta tggggctatt ctgttagaaa 
cccttaaccc agcagatttc ctaacgggat 
ccagacctag gcggaactcc cttcaggaca 
aggaaaaaaa ccacaatggg tattcagtaa 
tagaaaaatt gcctaataac tggtctcctc 
ccttaaagta cttacagaat caaaagacta 
ccctctctgt aatgcatttg cataagaact 
ctgggttgtt ataaaatagg aacccagccc 
caatgttggg catgctggta aaggaccact 
tggtcaagaa aggcgggaaa aggggtgcag 
gataaacaga ggtccatggg tggttacgca 
aggcaatgtt gggcacgctg gtaaaggacc 
ttgtggtcaa gagaggcagg aaaacaggtg 
ttcgataagc agaggtccat gggtggtgat 
tagaggacac tccaggacta aagctcatcg 
gttctttttt cagatgggaa acgttccccg 
ggagaattgg gaccaatttg accctcagac 
cagtgccgcc tggcactcct gagggaagta 
tcttttgtag aaaaggcaaa tggagtgaag 
gagacaactc acaattatgt aaaaagtgtg 
tacctcccta tcccagcatc cccgactcct 
caaatggtcc aaaaggagat agacaaaagg 
ccccaattat gacccctcca agcagtggga 
gtgccttttt ctctcccaga cttaaagcaa 
aaccctgatg gctatattga tgttttacaa 
agagatataa tgtcactgct aaatcagaca 
actgcagcct gagagtttgg cgatctctgg 



aggcaaagac aggaggtaaa gaaatagcca 240 
ggacaacaat cgggatataa acccaggcat 300 
rcccttccct trgtatggga gctgttttca 360 
gcactcttct ggtccatgtt: tcttacggct 420 
tgctgtttgc caccaccgca gacctgccgc 480 
gtccgctgtg ctcctgatcc agcgaggcgc 540 
tgccattgtt cctgcacggc taagtgcctg 600 
actgggttcc atggttctct tctgtgaccc 660 
acatggccca agattccatt ccttggaatc 720 
acgaggcttg ccaccatctt ggaagcggcc 730 
tcttgggagc tctgtgagca aggacccccc 840 
ccaaagtggt gagtaatatt ggaccactrt 900 
aattggagga aaataccggg cacttgtcgg 960 
acttaagact caggtgtgag gctatctggg 1020 
tgggttgggg acttggtttg cctcaagcca 1080 
gagggccgac tagaggcaga aagctgtcgt 1140 
catggtgtag ccagaagtct caacagtcgc 1200 
cccatacctc crgggtccca accacaactr 1260 
acctctgaat atacttcctc tgatccctgc 1320 
ttcctctagc aagttgtatc tccaaaggga 1380 
cacctaggct ataacccagg gagtcttatc 1440 
ctctrgacat gggcagttat gtaggaccca 1500 
ttgtaaatgg ctgagggaaa agagagacag 1560 
agagagacag agaggagaga gagacagtga 1620 
gagagagaga gagtcaaaga gagaaagaaa 1680 
tattccttta aaagccaggg raaatttaaa 1740 
gtgaccctat agcactccaa tccactttgt 1800 
gcactgaggc cattgacaac ccgtagcttc 1860 
cagatggacc aaatgcattc agtcggtagc 1920 
cttttagagg aaacctcatt gtgagcacac 1980 
aagcaaaaag gtagcttact aactcaaaaa 2040 
aaggtaatgt aactccaacc actgataatt 2100 
ttaaatctta artaccatac aaaggtccga 2160 
ggacgataga tggttcctcc caggtgattg 2220 
ttgatacggg gactcttgtg gaagcagagt 2280 
aaacgtgtga gctgtttgca ctcagccaag 2340 
tctcaatcct gattcaaaag gttagctaca 2400 
tgtttatggg aatgcatctt gatggggcag 24 60 
agctctagga ctcacccctg agcgcaaagg 2520 
agaatccagc agcccagacc cctttctttg 2580 
gactgctaca tcggtaagca taactaatcc 2640 
ccctggaaag gaactcaccc ctgagcacaa 2700 
actagaatcc agcagcctgg acccctttct 2760 
caggactgca acatcagtga gcataactaa 2820 
gcaccctgga aagaataagc attaggacca 2880 
gaaaatgact agggttgctg gcatccctat 2940 
caagacaaaa acgcccctaa gacgtattct 3000 
actaagaaag aaacgactta tattcttctg 3060 
taaattataa caccatctta cagctagacc 3120 
tgccataagt acaaactttc ttttcattaa 3180 
atttatgccc tacaggaagc cttcagagtc 3240 
tccccaacta ataaggaccc cccttcaacc 3300 
gtaaacagtg aaccaaagag tgccaatatt 3360 
ggaagagaat tcggcccagc cagagtgcat 3420 
ataaaaacag acttaggtaa attctcagat 3480 
gggttaggac aattctttga tctgacatgg 3540 
ctaaccccaa atgagagaag tgccaccata 3600 
tatctcagtc aggtcaatga taggatgaca 3660 
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acagaggaaa gagaatgatt ccccacaggc 
tgggacacag aatcagaaca tggagattgg 
gaaggactaa ggaaaactag gaagaagtct 
cagggaaggg aagaaaatcc tactgccttt 
cgtgcctctc tgtcacctga ctcttctgaa 
actcagtcag ctgcagacat tagaaaaaaa 
aacttagaaa ccctattgaa cttggcaacc 
caggcggaac aggacaaacg ggattaaaaa 
gcaagtggac tttggaggct ctggaaaagg 
ggcttgcttc cagtgcggtc tacaaggaca 
gccgccccct cgtccatgcc ccttatttca 
gggacaaagg tcctctgagt cagaagccac 
gtgcctgggg caagcgccat cccatgccat 
cattgagggc caggaggttg tctcctggac 
tgtcccggac aactgtcctc cagatctgtc 
cactagatac ttctcccagc cactaagtta 
ttttctaatt atgcttgaaa gccccactac 
aggggccatt atacacctga acataggaga 
ggaaggaatt aatcctgaag tctgggcaac 
ccgtcctgtt caagttaaac taaaggattc 
cctcagaccc aaggcccaac aaggactcca 
cctagtaaaa ccatgcagta acccctgcag 
cagacagtgg aggttagtgc aagatctcag 
gccagctgta cctagccctt atactctgct 
tacagtcctg gaccttcagg atgccttctt 
cttgtttgcc tttgaagata cttcaaaccc 
ccaagggttc agggatagtc cccatctatt 
atcctcatac ctggacactt gtccttcggt 
cagaaacctt gtgccatcaa gccacccaag 
acatggtttc caaaccaaag gctcaactct 
atccaaaggc accagggccc tcagtgagga 
tcccaaaacc ctaaagcaac taaggggatt 
gattcccagg tatggcgaaa tagccaggtc 
agccaatacc catttagtaa gatggacaac 
ccaagcccca gtgttaagtt tgccaacagg 
aacaggaata gctctaggag tccttacaca 
atacctgact aaggaaattg atgtagtggc 
ggtggcagta gcagtcttag tatctgaagc 
tgtgtggaca tctcatgatg tgaatggcat 
agacaactgt ttacttaaat gtcaggctct 
cacttgtgca actcttaacc cagccacatt 
taactgtcaa caagtaattt ctcaaaccta 
tttgactgat cccgacctca acttgtatac 
tcgaaaagtg gggtatgcag tggtcagtga 
tccaggaact agtgctcagc tagcagaact 
agaagaaaaa agggcaaata tatatacaga 
ccatgcagca atatggaaag aaagggaatt 
tcaggaagcc attaggaaat tattattggc 
acactgccgg ggtcatcaga aaggaaagga 
tattgaagcc aaaagagctg caaggcagga 
cctagtatag ggtaatcccc tccgggaaac 
atggggaacc tcacgaggac agttttctcc 
aaatactttt gcctgcaact atccaatgga 
acttaggcat cgatagcacc catcagatgg 
tcaaaactat caagcagata gtcagggcct 
cttatcgcca agctccttca ggagaacaaa 
aactgatttt acccacaagc ccaaacctca 
tactttcacg ggttgggcag aggccttccc 



4 

cagcaggcag ttcccag_c„ agaccc:ca: 3720 
tgctgcagac atttgctaac ttgtgtgcra 37S0 
atgaattact caatgatgrc caccataaca 3840 
ctggagagac taagggacgc attgaggaag 3 500 
ggccaactaa tcttaaagcg taagtttazc 3960 
cttcaaaagt ctgccgtagg cccggagcaa 4020 
tcggtttttt ataatagaga tcaggaggag 4030 
aaaggccacc gctttagrca tgaccctcag 4140 
gaaaagctgg gcaaattgaa tgcctaatag 4200 
ctttaaaaaa gattgtccaa gtagaagraa 4260 
agggaatcac tggaaggccc actgccccag 4320 
taaccagatg atccagcagc aggactgagg 4380 
caccctcaca gagccctggg tatgcttgac 4440 
actggtgcgg tcttcttagr cttact ct" 4500 
actatctgag ggggtccraa gacgggcag- 4560 
tgactgggga gctttattcr tttcacatgc 4620 
cttgttaggg agagacatcc tagcaaaacc 4 680 
aggaacaccc gtttgttgrc ccctgccrga 4740 
agaaggacaa tatggacgag caaagaargc 4800 
cacctccttt ccctaccaaa ggcagtacce 4860 
aaagattgtr aaggacctaa aagcccaagg 4 920 
tactccaatt ttaggagnac agaaacccaa 4 930 
gattatcaat gaggctgttg ttcctctata 5040 
ttcccaaata ccagaggaag cagagrggtt 5100 
ctgcatccct gtacatcctg actctcaatr 5160 
aacatctcaa ctcacctgga ctattttacc 5220 
tggccaggca ttagcccaag acttgagcca 5280 
aggtggatga tttactttrg gccgcccatr 5340 
cgctcttcaa tttcctcgct accrgtggct 5400 
gctcacagca ggttacttag ggctaaaatt 54 60 
acacatccag cctatactgg cttatcccca 5520 
ccttggcgta ataggtttct gccgaaaatg 5580 
attaaataca ctaattaagg aaactcagaa 5640 
tgaagtagaa gtggctttcc aggcccraac 5700 
gcaagacttt tcttcatatg tcacagaaaa 5760 
gatccgaggg atgagcrtgc aacctgrggc 5820 
aaagggttga cctcattgtr tacgggtagr 5880 
agttaaaata atacagggaa gagatctrac 5940 
actcactgct aaaggagacr tgtggctgtc 6000 
attacttgaa gggccagtgc tgcgacxgtg 6060 
tcttccagac aatgaagaaa agataaaaca 6120 
tgccactcga ggggaccttt tagaggttcc 6180 
tgatggaagt tcctttgtag aaaaaggact 624 0 
taatggaata cttgaaagta atcccctcac 6300 
aatagccctc acttgggcac tagaattagg 6360 
ctctaaatat gcttacctag tcctccatgc 6420 
cctaacttct gagagaacac ctatcaaaca 6480 
tgtacagaaa cctaaagagg tggcagtctt 6540 
aagggaaata gaagagaact gccaagcaga 6600 
ccctccatta gaaatgctta taaaacaacc 6660 
caagccccag tactcagcag gagaaacaga 6720 
cctcgggacg gctagccact gaagaaggga 6780 
aattacttaa aacccttcat caaacctttc 6840 
ccaaatcatt atttactgga ccaggccttt 6900 
gtgaagtgtg ccagagaaat aatcccctgc 6960 
gaacaggcca ttaccctgga gaagactggc 7020 
gggatttcag tatctactag tctgggtaga 7080 
ctgtaggaca gaaaaggccc aagaggtaat 7140 
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aaaggcacta gttcatgaaa taattcccag 
caatagccct gctttccagg ccacagtaac 
atatcactta cactgcgcct gaaggccaca 
aacactcaaa ggacatctaa aaaagcaaac 
gttgccrata gccttaaaaa gaatctgcaa 
cgaaatgctg tatggaaggc ccttcataac 
aacttagttg cagacatcac ctccttagcc 
ggaacctatc cctgagaaga gggaaaagaa 
aagtcccttc cctctaattc cccatcccta 
attttatcta ccccaactgc ggttaaagtg 
tgagtcaaat cctggatact gccaaaggaa 
tcctgtgaac ctctagagga tttgcgcctg 
ctaaaatcat aaatccccat ggccctccct 
ccctctttca ctctcactgc accccctcca 
caagagtttc tatggagaat gcagcgtccc 
ctttctaagg gaacccccac cttcactgcc 
tctgccactc tttgcatgca tgcaaatact 
agttgtcctg gaggacttgg agtcactgcc 
tctgatgggg gtggagttca agatcaggca 
caactcaccc gggtacatgg cacctctagc 
catgaaaccc tccgtaccca tactcgcctg 
ctccatgagg tctcggccca aaaccctact 
aggccatatg tttcaatccc tgtacctgaa 
accacttccg ttttagtagg acctcttgtt 
ctcacctgtg taaaatttag caatactaca 
gtaactcctc ccacacaaat agtctgccta 
tcagcctatc gttgtttgaa tggctcttca 
ccccctatga ccatctacac tgaacaagat 
aacaaaagag tacccattct tccttttgtt 
actggcattg gcggtatcac aacctctact 
aatggggaca tggaacgggt cgccgactcc 
ctagcagcag tagtccttca aaatcgaaga 
ggaacctgtt tatttttagg ggaagaatgc 
actgagaaag ttaaagaaat tcgagatcga 
actggaccct ggggcctcct cagccaatgg 
ctagcagcta taatattgct actcctcttt 
tttgtcrctt ccagaatcga agctgtaaaa 
actaagatct accgcagacc cctggaccgg 
atcaaaggca cccctcctga ggaaatctca 
gcaggaagca gttagagcgg tctcggccaa 
gagatggggg actgagagac aggactagct 
gcctagctgg gaaggtgacc acatccacct 
cctgaccaat cagagagctc actaaaatgc 
agccaatcat ctattgcctg agagcacagc 
agtcttcgag ccggcaacgg caaccccctt 
ttttcatgct atttcactct attaaatctt 
acggcttgag ctgagctttc gctcgccatc 
cgccgctgac tcccatccct ctggatcatg 
aggcacccat tgccgctccc aatcgggcta 
tgcctgggtt catcctaatt gagctgaaca 
tgacccacag cttctaatag agctataaca 
gaatccataa ggccaagaac cccaggtcag 
ctctgtgagc aaggaccccc aagtaacaca 
atggtagagc aagaaaacag aagggccctg 
cctgccctgg atgtcctatt cctaggtgtt 
tcacttctcc aagtagggct tctattacag 



5 

attcggactt ccccgaggc- tacagagtga 7200 
ccagggagta tcccaggcg: taggtatacg 7260 
gtcctcaggg aaggtcgaca aaatgaatga 7320 
ccaggaaacc cacctcaca: ggcczgczcz 7380 
ctttccccaa aaagcaggac ttagcccata 74 40 
caatgacctt gtgcttgacc caagacagcc 7500 
aaatatcaac aagttcttaa aacattacaa 7560 
ctattccacc cttgtgacaz ggtattagnc 7620 
gatacatcct gggaaggacc ctacccagtc 7680 
gctggagtgg agtcttggar acatcacact 7740 
cctgaaaatc caggagacaa cgctagctat 7800 
ctcttcaaac aacaaccagg aggaaagtaa 7860 
tatcatattt ttctctttac tgttctttta 7920 
tgccgctgta tgaccagtag ctccccttac 7980 
ggaaatattg atgccccatc gtataggagr 8040 
cacacccata tgccccgcaa ctgctatcac 8100 
cattattgga caggaaaaa: gattaaiccr 8160 
tgttggactt acttcaccca aacrggracg 8220 
agagaaaaac atgtaaaaga agtaatctcc 8280 
ccctacaaag gactagatcr ctcaaaacta 8340 
gtaagcctat ttaataccac cctcacnggg 8400 
aactgttgga tatgcctccc cctgaacrtc 8460 
caatggaaca acttcagcac agaaataaac 8520 
tccaatctgg aaataaccca tacctcaaac 8580 
tacacaacca actcccaatg catcaggtgg 8640 
ccctcaggaa tattttttg- ctgrggtacc 8700 
gaatctatgt gcttcctctc attcttagtg 8760 
ttatacagtt atgtcatatc taagccccgc 8820 
ataggagcag gagtgctagg tgcactaggt 8880 
cagttctact acaaactatc tcaagaacta 8940 
ctggtcacct tgcaagatca acttaactcc 9000 
gctttagact tgctaaccgc tgaaagaggg 9060 
tgttattatg ttaatcaatc cggaatcgtc 9120 
atacaacgta gagcagagga gcttcgaaac 9180 
atgccctgga ttctcccctc cttaggacct 9240 
ggaccctgta tctttaacc" ccttgttaac 9300 
ctacaaatgg agcccaagat gcagtccaag 9360 
cctgctagcc cacgatctga tgttaatgac 9420 
gctgcacaac ctctactacg ccccaattca 9480 
cctccccaac agcacttagg ttttcctgtt 954 0 
ggatttccta ggctgactaa gaatccctaa 9600 
ttaaacacgg ggcttgcaac ttagctcaca 9660 
taattaggca aagacaggag gtaaagaaat 9720 
aggagggaca atgatcggga tataaaccca 9780 
tgggtcccct ccctttgtat gggagctctg 9840 
gcaactgcac tcttctggtc catgtttctt 9900 
caccactgct gtttgccgcc accgcagacc 9960 
cagggtgtcc gctgtgctcc tgatccagcg 10020 
aaggcttgcc attgttcctg catggctaag 10080 
ctagtcactg ggttccatgg ttctcttctg 10140 
ctcaccgcat ggcccaaggt tccattcctt 10200 
agaacacgag gcttgccacc atcttgggag 10260 
accatgaggg tgcaaatgca tgggccacta 10320 
gttcctcgaa ggcatcagtg agctgaaatg 10380 
tttctgcctg aagcagatta aaccctttgt 10440 
cccaaatcaa tccccacccc agatgacat 104 99 
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<210> 4 

<211> 2784 

<212> ADN 

<213> Homo sapiens 



<400> 4 

ctccttcagg 

cccatatgcc 

gttgggcaga 

aaataattcc 

aggctacagt 

cctggaggcc 

taaaaaagct 

taagaatccg 

ggcccttcct 

tcatctcctt 

aagagggaaa 

attccccatc 

cggcagttaa 

tactgccaaa 

aggatctgcg 

cctggccctc 

tgcaccccgt 

agcaagagtt 

gtttatctaa 

actctgccac 

ccagttgtcc 

tggagttcaa 

ggtacatagc 

cd&tacccat 

ctcggcccaa 

ttcaatccct 

tttagtaggt 

atttagcaat 

acgaatagtc 

tttgaatggc 

ctacactgaa 

cattcttcct 

tatcacaacc 

atgggtcgct 

ccttcaaaat 

tttagaggaa 

agaaattcaa 

cctcctcagc 

attgttactc 

aatcgaagca 

taaaatctac 

caaaggcacc 

aggaagcagt 

agagggggga 

actagctggg 

ccaaccaatc 

aaagaaatag 



agaacaaaga 
caaatctcag 
ggccttcccc 
cagattcgga 
aacccaagga 
acagtcctca 
aatccaggaa 
aaactctccc 
aaccaatgaa 
agccaaatat 
ggaactattc 
cctagataca 
agtggctgga 
ggaactcaaa 
cctgctcttc 
ccttatcata 
ccatgccact 
tctatggaga 
gggaaccccc 
tctttgcatg 
tggaggactt 
gatcaggcaa 
acccctggcc 
actggcctgg 
aaccctacta 
atacctgaac 
cctctttcca 
actatagaca 
tgcctaccct 
tcttcagaat 
caagatttat 
tttgttattg 
tctactcagt 
gataccctgg 
cgaagagctt 
aaatgctgtt 
ggtcgaatat 
caatggatgc 
ctctttggac 
gtaaaactac 
cacggacccc 
cctcccgagg 
tagagtggtt 
ctgagagaca 
aaggtgaccg 
agatactaaa 
ccaatcatct 



acaggccact 
ggatttcagt 
tgtaggacag 
cttccccaag 
gtatcccagg 
ggaaaggtgg 
acccacctcg 
caaaaagcag 
cttgggcttg 
caacaggttc 
caccctggtg 
tcctgggaag 
gcggagtctt 
aatccatgag 
aaatgacaac 
tttttctctt 
gcaccccgtc 
atgcagcgtc 
accttcactg 
catgcaaata 
ggaggactca 
cagaaaaaca 
cctacaaagg 
taagcctatt 
actgttggat 
aatggaacaa 
atctggaaat 
cagccaactc 
caggaatatt 
ctgtgtgctt 
acaatcatgt 
gagcaggagt 
tctactacaa 
tcaccttgca 
tagacttgct 
gttatgttaa 
aacgtagagc 
cctggattct 
cctgtatctt 
aaatcgttct 
tggaccggcc 
aaatctcaac 
gttggccaac 
ggaataacta 
cttccacctt 
gagagctcac 
gttg 



acccaagaga 
atctactagt 
aaaaggccca 
gcttacagag 
tgttaggtat 
agaaaatgaa 
catggcctgc 
gacttagtcc 
accgagagac 
ttaaaacatt 
acatggtatt 
gaaactaccc 
ggatacatca 
acaatgcxag 
cagggggaaa 
tactgttctc 
catgccccgt 
ccggaaatat 
cccacaccca 
ctcattattg 
cttcactcat 
cataaaggaa 
actagatctc 
taataccacc 
gtgcctcccc 
cttcagcaca 
aacccatacc 
ccaatgcatc 
ttttgtctgt 
cctctcattc 
catacctaag 
gctaggcgga 
actgtctcaa 
agatcaactt 
aaccgcggaa 
tcaatccgga 
aaaggagctg 
ccccttctta 
taacctcctt 
tcaaatggag 
tgctagccca 
tgcacaacct 
ctccccaaca 
gatttcctag 
taaacaccgg 
taaaatgcta 



agactggcaa 
ttgggtagat 
agaggtaata 
tgacaatggc 
acaatatcac 
caaaacactc 
tctgttgcct 
atacaaaatg 
agccaactta 
acagggagcc 
agtcaagtcc 
agccatttta 
cactcaagtc 
ctattcctgt 
gtaactaaaa 
ttaccccctt 
ccatgccagt 
tgatgcccca 
tatgccccac 
gacaggaaaa 
accagtatgt 
gtaatctccc 
tcaaaactac 
ctgactgggc 
ctgcacttta 
gaaataaaca 
tcaaacctca 
aggtgggtaa 
ggtacctcag 
ttagtggccc 
ccccgcaaca 
gtagctactg 
gaactaaatg 
aactccctag 
agcgggggaa 
atcatcaccg 
caaaacactg 
ggacctctag 
gttaagtttg 
ccccagatgc 
tgctctgatg 
ctactacgcc 
gcagttgggt 
accaactaag 
gcttgcaact 
attaggcaaa 



ctagatttta 
actttcactg 
aacgttcatg 
cctgctttca 
tcacactgcg 
aaatgacatc 
atagccttac 
ctgtatggac 
gttgcagaca 
tgtccccaag 
cttccctcta 
tctaccctaa 
aaaccctgga 
gaacctctag 
tcgtaaatcc 
tcactctcac 
agctcccctt 
rtgtatagga 
aactgctata 
acgattaatc 
ctgatggggg 
aactgacctg 
atgaaaccct 
tccatgaggt 
ggccatacat 
ccacttctgt 
cctgtgtaaa 
ctcctcccac 
cctatcattg 
ctatgcccat 
aaagagtacc 
gcattggcgg 
gtgacatgga 
cagcagtagt 
cctttttatt 
agaaagttaa 
gaccctgggg 
cagctataat 
tcttttccag 
agtccatgag 
ttaatgacat 
ccaattcagc 
tttcctgttg 
aatccctaag 
tagctcacgc 
aacaggagat 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2784 
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<210> 5 

<211> 1799 

<212> ADN 

<213> Homo sapiens 



<400> 5 

gggattctta 

aggaaaaccc 

aattggggca 

cattacaatt 

tggacttcat 

aagagacaaa 

gagctgctag 

agggtctggt 

actttctctg 

acataataac 

aagtctaaag 

aaggtgacca 

tagtagaact 

cctgctccga 

taattgtata 

acatagattc 

ttcctgaggg 

tggttgtgtc 

ccagattgga 

tgttccattg 

accaacagtt 

ataggcttac 

ctttgtaggg 

gtttttctct 

aagtccgaca 

tccaataatg 

tatgggtgtg 

caatatttct 

tacagcagca 

aaatatgata 



gtcggcctag 
aagtgctgtt 
tagtaggggt 
ggagcatggg 
ctggggttcc 
cttaacaagg 
agatcctaag 
gtttttgaag 
tgacaattca 
aacattcttc 
ctcttcaatt 
gggagtcggc 
gagtagaggt 
taacaaaagg 
aatcttgttc 
tgaagagcca 
taggcagact 
tacagtattg 
aacaagaggt 
ttcaggtaca 
agtagggttt 
caggcaagta 
gctaggggtg 
tgcctgatct 
gacagtggct 
agtatttgca 
ggcagtgaag 
gggaagccgc 
tggagggggt 
agggagggcc 



gaaatccagc 
ggggaggttg 
tgtgcagttg 
ctagtaggcc 
atttgaagaa 
aggttaaaga 
aaggggagaa 
ctcctctgtt 
ggattgatta 
ccctaaaaat 
ttgaaggact 
aacccattcc 
tgtggtaccg 
aagaatgagt 
agtgtaaatg 
ttcaaacaac 
attcgtgtgg 
ctaaatttta 
cctactaaaa 
gggattgaaa 
tggaccgaga 
tgggtatgga 
ctatgtaccc 
tgaactccac 
ccaagtcttc 
tgcatgcaaa 
gtggagtttc 
attcttcata 
gcagtgagag 
atggggattt 



taatcctgtc 
gctgacgacc 
agatttcctc 
ggtccagggg 
cgatttgtag 
tacagggtcc 
tccagggcat 
ctacgttgta 
acataataac 
aaacagcttc 
actgatgcta 
atgtcaccat 
ccaatgccag 
actcttttgt 
gtcatggggg 
gataggctaa 
gaggagttac 
cacaggtgag 
cggaagtggt 
tgcatggcct 
cctcatggag 
gggtttcatg 
gggtcagttg 
ccccctcaga 
caggacaact 
gagtggcaga 
ctttaggtaa 
gaaactcttg 
tgaaaggggg 
acgattttag 



tctcagtccc 
agtctaactg 
gggaggggtg 
tccacggt ag 
ctttacaact 
aaagaggagt 
ccattggctg 
ttcaatctcg 
aacattcttc 
cccctctttc 
ggaagttaag 
tgagttctrg 
aacctagtcc 
tgtggggctt 
cactaagaat 
ggtaccacag 
ccacctgatg 
gtttgaggta 
gtttatttct 
gaaatacagg 
cccagtgagg 
tagttttaag 
ggaggttact 
cataccagta 
aggattaatc 
gttatagcag 
actcctattt 
gtaaggggag 
taagagaaca 
ttactttcct 



cccactcaac 
cttcctgcgc 
cgttcgata- 
atcttagtca 
ttgattctgg 
atcaatatia 
aggaggcccc 
aatttc- tea 
cgctaaaata 
agaggttagc 
ttgatct tec 
agatagtttg 
acctagcact 
aggtacaaca 
gagaggaagc 
acaaaaaata 
cattgggagt 
tgggttattt 
gtgctgtagt 
gggaggcaca 
gtggtattaa 
agatctagtc 
tcctttacat 
tgggtgaagt 
attttccctg 
ttgtggggca 
gatggggcat 
ctgctggttg 
gtaaagagaa 
cacggttgt 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1799 



<210> 6 
<211> 1489 
<212> ADN 

<213> Homo sapiens 



<400> 6 

tggtgcttgc 

ctcagaggac 

gcatggacga 

accgcactgg 

gcctccaaag 

tttgtcccat 

caatagggtt 

gtctgtagct 

agttgacaga 

ggattttctt 

ctagttttcc 

tgttctgatt 

aatcgttctc 

ccaaactctc 



cccgggcact 
ctacgtcccc 
gggggegget 
aagcaaaccc 
tccgcttgcc 
tctgcctgct 
tctaagtttt 
gactgagtga 
gagaggtatg 
cctttccctg 
ttagtccttc 
ctgtgtccca 
tttcctctgt 
aggctgeagt 



ctcagtcctg 
tggggcagtg 
tatttctatt 
tattaggcat 
tgagggecat 
catcctgatc 
gttccgggcc 
taaacttatc 
cttcctcaat 
tgttatagtg 
tagcaegcaa 
gtgagggtct 
tgtcgaccta 
taeggegaca 



ctgctggatc 
ggccttacag 
tggacaatct 
ttgatttgee 
gaetaaageg 
tctattataa 
taaggcagac 
ctttaagatt 
gcctccgtta 
gacatcattg 
gttagcaaat 
acactgggaa 
tcattgacct 
cttctgtcat 



atctggttag 
tgattccctt 
tttttaaagt 
tagcttttcc 
gtggcctttt 
aaaactgagg 
ttttgaagtt 
agttggcctt 
gtcactccag 
aataactcac 
gtctgeggea 
ctgcctgctg 
gactgagata 
ttggggttag 



tggcttctga 60 
gacacgaggt 120 
gtccttgtag 180 
cttttccagt 240 
ttttatccca 300 
ttgccaagtt 360 
ttttcctaat 420 
cagtagagtc 480 
aaaggcggta 54 0 
aggcttcttt 600 
ccaatctcca 660 
gcctgtgggg 720 
ccagagatcg 780 
tgtctgattt 840 
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agcagtaaca ttatatctct ccatatcaga 
tcaatatagc cattagggtt atctgagaat 
ggagagaaaa aggcacatgc actctggctg 
agagagaaaa aggtacgtgc actctggctg 
ggcataatcg gggaatattg gcattctttg 
tttggaccgt ttgggttgaa ggggggtcct 
tggggtaggg aggtagactc tgagggcttc 
attgcgagtt gtctcttaat gaaaagaaag 
cttcttttct acaaaagagg tctagctgta 
gatgccaggt ttctccccct taaagagtat 
tgtctttttt ttcttagcat ctgagagtca 



8 

tcaaaggatt gtcctaaacc ttgtaaaaca SOC 
ttacctaggt ctattt raa; ttaaagtctg 96C 
ggccgaattc tcttccrccc actgcgtctg 1020 
ggccgaattc tcctcccacc gcttggaggg 1080 
gttagttgtt taccccrttg tctatctccr 1140 
tattatttgg ggaaggagtc tgggggatgc 1200 
ctgtagggca taaatcacac tttttacata 1260 
tttgtacgta tgacacttca caccatttgc 1320 
agatggtgtt ataatttatg cttccctcag 1380 
atcgttgcca ggcggtaccg cagaagaata 1440 
aattggtccc aattctcca 1489 



<210> 7 
<211> 1216 
<212> ADN 

<213> Homo sapiens 
<400> 7 

taaagataca gggattgaaa tgtatggcct 
gaaaatgggg tttcctttag aaaaactcct 
ccgcattctc catagaagct cttggtaatg 
gggtgcagtg agagtgaaag agggtaaaag 
gggttcagtg agagtgaaag ggggtaagag 
gccatgagga tctacgattc tagttacttt 
agatcctcta gaggttcaca ggaatagcta 
ggcagtatac agagtttgac tcgagtgtga 
accgcagttg gggtagataa aatgactggg 
ggggacttag aaggaaggga cttgactaat 
ccctcttctc gggaacaggt tccctgtaat 
gaggtgatgt ctgcaactaa gctggccatc 
aagggccatc catacagcat tttgtatggg 
attcttagta aggctgtagg caacagagca 
ttttttaaat gtcgtttgag tgcttcattc 
ctccacgcgc agtgtaagtg atattgtatg 
gtagccttga aaacggggcc attgtcactc 
attatttcat gaattagtgc ctttattaca 
gcctctgccc aaccagtgaa aatatctacc 
ttgggcatgt gggtaaaatc tagttgccag 
tctcctgaag gagctt 



gaagtgcagg gtcatatagg tgtgggtggt 60 
atacgatggg tcatcaataz ttccaggaag 120 
ggagctactg gtagtacagt ggcatggagg 180 
aacagtaaag agaaaaatat gataagggag 240 
aacagtaaag aaaaaaatat gacaaggagg 300 
cctcacggtt gtcgcttgaa gagcaggtgc 360 
gcgttgtctc ctggattttc gggttccttt 420 
tgtattcaag actccactcc agccacttta 480 
tagggtcctt cccaggatgt atctaaggat 540 
accatgtcac cagggtgcaa taattacttt 600 
gttttaagaa cttgttgata tttggccaag 660 
tctcggtcaa gcacaaggtc cttggttagg 720 
ctaagtcctg ctttttgggg agagttttgg 780 
ggccatgcaa ggtgggtttc ttgggttagc 840 
attttcttga cttttcctga ggattgtggc 900 
cctaatgcct gggatactcc ctgggttact 960 
tgtaagcctc ggggaagtcc gaatctggga 1020 
tcttggtcct tttctgtcct acaaaggaag 1080 
cagactagta gatactgaaa tccctgagat 1140 
tcttctcctg agtaatggcc tgttctttgt 1200 

1216 



<210> 8 
<211> 976 
<212> ADN 

<213> Homo sapiens 
<400> 8 

agtgataatg gaatacttga aagtaatccc 
aaactaatag ccctcactcg ggcactagaa 
acagactata agtatgctta cctagtcctt 
gaattcctaa cttccaaagg aacacctatc 
ttggtggtac agaaacctaa agaggtggca 
aaggaaaggg aaatagaagg gaactaccaa 
caggaccctc cattagaaat gcttatagaa 
gaaagcaatc cccagtactc agcaggagaa 
ttcctcccct caggatggct agccaccaaa 
caatggaaat tacttaaaac ccttcaccaa 



ctcactccag gaactagtgc tgagctggcc 60 
ttaggagaag agaaaagggt aaatatatat 120 
catgcccatg cagcaatatg gagagaaagg 180 
aaacatcagg aagccattag gatattatta 240 
gtcctacact gctggggtca tcagaaaaaa 300 
gcagatattg aagccaaaag agccgcaagg 360 
ggacccctag tgtggggtaa ccccctccag 420 
ataaaatgga gaacctcacg aggacatact 480 
gaaggaaaaa tgcttttgcc tgcagctaac 540 
acctttcact taggattgat agcacccatc 600 
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agatggccaa 
gggcctgtaa 
ctgtatcttt 
aatggttctt 
ggagggggcc 
aaatctcaac 
atcggccaac 



attattattt actggatcag gccttttcaa aactatcaag caggtagtca 660 

agtgtgccaa agaaataatc tcctgcactg caagccaiac atttcaatcc 720 

aacctccttg ttaagtttgt ctcttccaga atcaaagctg taaaactaca 780 

caaatggagt ctcagatgca gtccatgact aagatatacc gcagccccct 840 

tgctagccca tgctccaatg ttaatgacat cgaaggcacc cctcccgggg 900 

tgcacaaccc ctactatgtc ccaattcagc aggaagcagt taaagcggtc 960 

ctcccc 976 



<210> 9 
<211> 942 
<212> ADN 

<213> Homo sapiens 



<400> 9 

agaggagaac 

agagaaagag 

aaagtcaaag 

gacacagaaa 

ggagaaagag 

cagggtaaat 

tatctgcctc 

aatagactct 

tgaaaaagga 

ggggatagta 

cctttcaaat 

tcctgtggca 

caaatttgtt 

ccaaaagagt 

ccctggccta 

atccagcagg 



agcagcataa 
aaagagaaag 
aggtagtagt 
gtcaaaaaaa 
agagatagaa 
ttctatctac 
tcagacagtt 
ttggcagcag 
ggacactaca 
tgagatgctg 
tcttatacca 
gccatcttgc 
tcctctagaa 
tcaacraaca 
gagagttccc 
agtagctaga 



gcggctggca 
tcagagaaag 
cagaaacaga 
aagttaagaa 
gtagtaaaga 
ccagccaagg 
tgcaagaaat 
tgactctcca 
ccttcttagg 
cccggagttt 
acttctggag 
tgttactcgc 
tcgaggccat 
acttctaccg 
ctctgaagga 
gtggtcatcg 



gaggtaggga 
agacagagag 
gacaaaaaaa 
gaaaggaaaa 
aaaaaacagc 
catattctac 
aatgaaatct 
aaactgcaga 
ggaagaatgt 
acaggaaaag 
ttaggcaaca 
ctttgggccc 
caagctacag 
aggacccctg 
caccgcaact 
gccaaattgc 



aagaccagca 
aggaagagac 
aggagtcaga 
gacaaagaag 
atatcccatt 
ttatgtggar 
atccttactt 
ggcctagacc 
tgtttttaca 
gcttctgaaa 
tggcttctcc 
tgtattttta 
atggtcttac 
gatcaaccca 

ca 



agaagaaaag 
aaagagacag 
aagagggaca 
aagtcgaaga 
cctttaaagc 
cttcaaccca 
tacaatccca 
tcctcactgc 
ctaaccagtc 
tcagacaacg 
cctttctagg 
accttcttgt 
aaatggaacc 
ctggcacttc 
tctttgcccc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

942 



<210> 10 
<211> 1375 
<212> ADN 

<213> Homo sapiens 



<400> 10 

ccccaatatt 

actatcctgc 

gtccaagctt 

cccacaggag 

attgatgata 

aaaggtccac 

gaatttggcc 

cagacctggg 

ggcaaacctt 

ttaatgaaaa 

gtcaagtaaa 

ccatccccag 

aacatctgtt 

attcaatgat 

ggctacaaga 

tgattctaaa 

agcaagccct 

tctataatag 

cagccttagt 



ctctttctga 
agcttgatct 
tcttttcatt 
gacccctcag 
ctcctcctct 
aaaaaccccc 
caacccgggt 
gaagttttca 
tgacctcact 
gaatgcggct 
tgaaagaatg 
tatggatccc 
gatctgtgtt 
atccaccata 
ggccttaaga 
agataagttt 
gagccctgaa 
ggaccaagag 
catggccctc 



tggggaaaaa 
tttctgtaag 
gagggagaat 
cttaccccca 
aatctcccct 
gggctatcgg 
gcatgtcccc 
gatgatcctg 
tggagagacg 
ttagctgcag 
acagccgaag 
cactgggact 
ctggaaggac 
acccagggaa 
aaatatactc 
attacccaat 
caaaatctag 
gaacaggccc 
agacaaacaa 



tggccacctg 
agggaaggca 
acacaactat 
tatcctagcc 
gcccagaagg 
ttatgtcccc 
ttctccctct 
ataggtacat 
tcatgctact 
cctgagagtt 
aaagggacaa 
ttgactcaga 
taaggagaat 
aggaagaaaa 
ccctgtcacc 
cagccacaga 
agacattatt 
aaaaggaaaa 
accttggtgg 



agggaagcac 
aatggagtga 
gcaaagcttg 
tccctatagc 
aaataagcaa 
ttcaagctgt 
ctgatttaaa 
agatgtccta 
gttagatcaa 
tggagatacc 
cttccctact 
tcatggggac 
tgggaaaaag 
tccttctgcc 
cgaatcactc 
tatcaggaga 
aaacctggca 
gcgagatcag 
ttcagagagg 



aaattacaat 
aataccttat 
caatttacat 
ttcccttcct 
agaaatctcc 
agggggaggg 
gcagatcagg 
cagggtctag 
accctggcct 
tggtatccta 
ggtcagcaag 
tggagtcgta 
cccatgaatt 
ttcctcgagc 
gagggtcaat 
aagctccaaa 
accttggtgt 
agaaaggccg 
tcagaaaatc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 
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gagcaggcca atcacctggt acggcttgtt 
aagattgtcc aataagaaac aagctgcccc 
actggaaggt gcactgcccc agaggatgaa 
tgatccaaca acaggactga gggtgcccgg 



10 

atcagtgcgg tttactagga cactttaaaa 1200 
ctcatccgtg tccactatgc cgaggcaatc 1260 
ggttccctgg gttagaagcc cccaaccaga 1320 
ggcaagcacc agctcatgtc atcac 1375 



<210> 11 
<211> 944 
<212> ADN 

<213> Homo sapiens 
<400> 11 

acctaggagg aactgtcttc aggacaggac tatagatgct tcctcccagg cgattaaggg 60 

aaaaagacac aatgggtatt cagtaagtga taaggaaact cttgtagaag cagagttagg 120 

aaaattgcct aataattggt ctgctcaaat gtgcgagctg tttgcactca gccaaaccti 180 

aaaagtatta cagaatcagg aagaagccat ctataccaat tctaagttaa tatggactga 240 

acgagaactt attaatagca aagaataatt gaaatcccaa acttacaagg ttttcaacaa 300 

aagcacagtt tgctaaaagt taactgtgta acargtatta tcctactacc acaaactcic 360 

aaatgatttc tcagacagtt tgcaagaaac aatgaaacct atccttactc tacaatccca 420 

aatagactct ttggcagcag tgactctcca aaaccaccaa ggcctagacc tccrcactgc 480 

tgagaaagga ggactctgca ccttcttagg ggaagartgt tgtttttaca ctaaccagtc 540 

agggatagtg tgagatgcca cccagcgttt acaggaaaag gcttctgaaa tcagacacaa 600 

tgcttttcaa accttatagc aacctctgga gttcggcgac tggcttttcc cctttctagg 660 

tcctgtgaca gccatcttgc tattactcgc cttcgggccc tgtattttta acctcctcgt 720 

caaatttgtt tcctctagga tcgaggccat caagctacag atggtctzac aaatggaacc 780 

ccaaatgagc tcgactaaca acttctactg aggacccctg gaccgaccca ctggccctzt 840 

aactggctta aagagtttcc ctctggagga cactacaact gcagggcccc ttctttgccc 900 

catccacagg aagttagcta gagcagtcat cacccaattc ccaa 944 



<210> 12 
<211> 963 
<212> ADN 

<213> Homo sapiens 
<400> 12 

tacaggaacc ccataatacg tccttggcaa 
cccatttgtc ctgaaccctc aaatcatggg 
ccttatgagt tttcagctac aggggtgtat 
tggaagatcc ttctatattt gcctccccac 
catagtacct cctgtgactt atccttttca 
aagcttcagc cgagagcaat ctcactactt 
acctaggaag tggactcaca gcctagatga 
ccaaatagac tcattagcag ctgtggttct 
cctcactgcc gaaaggggag gaacatgcct 
caataaatca ggcatagtga gagatggaat 
acatggtggg acaaccgaaa ctacctcagg 
tccattttta ggtcccttcc ttatgattat 
cagttccttc atcctttcgt ttcttcctga 
cagatggaac ctcagatgac ttcaaccagc 
gccggcccat acccggacgt tgacacccaa 
gaaccccttc tatgccccta ttcagcagga 
caa 



attctattca gctccaactg ctaggagtgg 60 
aatgagaaat gaatttagac tgaccacagc 120 
agaaccctga taaggagttt tctttgtgtg 180 
caactggaca ggaacttgta ctttagccta 240 
gaagaggcag tagctgtgcc cattcatgct 300 
cctctattgg ctggtttagg atttactacc 360 
aatctctctc caacttactc aaatccagga 420 
ccgaaccagt gagcactaga tctccaatct 480 
ttttctgaac aaggaatgtt gtttttatgt 540 
taaatgactt caggatagag ctagcagact 600 
gttctcacag cctgttctcc actggcttct 660 
tctaggagta acctttggcc catgtctttt 720 
atagaatcaa tgaaactaga aatgttactg 780 
acctattatc aaggacccct aaaccagcct 840 
accacctctc acgaggaaac ctcagctaca 900 
agcaattaga gtggtcatcc tcccacaccc 960 

963 
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<210> 13 

<211> 1362 

<212> ADN 

<213> Homo sapiens 

<400> 13 

ccacaacatc ctcttccagg aggagaacga 
accatcctgc aactagatct gttttgtaaa 
gttcagacct ttttctcatt aagggatgat 
caccccacag ggagtcctca aattctaccc 
actaatgcca aaccctctct ggcttctaca 
agagagccaa gagaccccac tggcccctgg 
tttggcccaa cccgagtaca tgttcccttt 
gacttggatg aaagttctca gatgacccca 
gacaatcttt tgacctttcc tggagagaga 
taatgagaag aatgctgctt taacaggagc 
ttaagtaagt gatagaatga catcagaaga 
cccagtatgg atccccactg ggaccctgac 
ttactgacct gtatcctaga agggttaagg 
atgatgtcta ctataaccca agggaaggaa 
agggaggctt tgagaaaata tactcccctg 
ttaaaggaca aatttattac tcagtcagct 
gccttgggcc gagcaaaatt tggaggcatc 
tagggaccaa gaggaacagg ccgaaaagga 
agtcatgccc tcagacaaac cttggcggtt 
cacccagcag ggcttattat cagtgcagtt 
agagaaataa gccgccctct cacccatgtc 
actgtcccag aggacaaagg ttctctgggc 
aggatggagg gtgcccgggg caagcaccag 



11 



tggccacctg agggaagtat acactataat 6C 
caagaaggca agtggattta ggtaccatat 120 
aacccacgat tgtgtaagac atgtaacctg 180 
ccatacccag tcctccccac ggctcctcct 240 
gcccaaaagg gaacaaataa aagagccttc 300 
ctatgtcctc ttcaggctgt aggaggggaa 360 
tctctctctg atctaaagca aattaaggca 420 
atagatacgt agatggcctg ctgggrctgg 480 
tcatgttatt gcttgatcag acctaacctc 540 
ccgagagttt ggggatacct ggtacctcag 600 
gagcagtttc ctactggcca gcaagcagnc 660 
tcggatcatg gggactggag tcacaaaca: 720 
agaactagga aaaagcccat gaactattca 780 
gaaaacccta ttgccttcct caaaaggctg 840 
tcaccagatt ccctcgaagg ccagttaatt 900 
gcagacatta ggaaaaagct ccaaaagtta 960 
attaaacctg gcaacctcag tgttctatca 1020 
aaagcaggat aagagaaagg ctgcagattr 1080 
caaagaggag aaaaaatgga gcaggccaat 114 0 
tacaaggaca ctttaaacaa gatrgtccaa 1200 
cactatgcca aggtgatcac tggaaggcac 1260 
cagaagtccc caaccagatg atccagcaac 1320 
ctcgtgttgt ca 1362 



<210> 14 

<211> 945 

<212> ADN 

<213> Homo sapiens 

<400> 14 

ttgcagatca atctcagact gctgtgctag 
ctctgagcca ggcatgggat ataatgtcct 
gcacagtatt agggtgggag tggcccgatt 
ggctaggaaa gagaattccc tgaccccttg 
gcttcagctc acactcaggt gactgcaccc 
cagtgagatg aacctggtac ctcagttgga 
tcacactggg agctgtagac tggagctgtt 
aatagactct ttggcagcag tgactctcca 
tgagaaagga ggactctgca ccttcttagg 
agggatggta cgagatgcca cccgatgttt 
cctttcaaac tcttatacca acctctggag 
tcccattgca gccatcttgc tattactcgc 
caaatttgtt tcctctagaa ttgaggccgt 
ccaaatgagc tcaactaaca acttctgcca 
cactggcctt aagagttccc ctctggaggg 
ctatccagca ggaagtagct agagcagtca 



caatgagtga ggcttcgtgg gcatgggacc 60 

tgtgtgccat ttgctaagac tgttggaata 120 

ttccaggtgc tgtctgtcac cgcttccctt 180 

ttcttcccag gtaaggcagt gcctcaccct 240 

actgtcctgc ccccactgtc ggacaagccc 300 

aatgcagaaa tcacctgtct tctgcgtcac 360 

cctatttggc catcttggaa ccatctccca 420 

aaaccaccaa ggcctagacc tcctcattgc 480 

ggaggagtgt tgtttttata ctgaccagtc 540 

acaggaaaag gcttctgaaa tcacacaaca 600 

ttgggcaaca tggcttctcc cctttctcgg 660 

cttcaggctg tgtattttta acctccttgt 720 

caagctacag atggtcttac aaatgggacc 780 

aggacccctg gaccaacctg ctggcccttt 84 0 

cactacaact gcagggcccc ttctttgccc 900 

tcacccaatt cccaa 94 5 
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<210> 15 
<211> 939 
<212> ADN 

<213> Homo sapiens 
<400> 15 

agagctacct tggcaagtac tctaggagta tgggaaaatg aaaacaacaa actcacacac 60 
cattttaaca tacacaatca ggtctgccca cccagcaagg tatattcttt gtatgtggaa 120 
catcgaccta tatctgcctc cccactaact agacagccac ctgaatctta gtctttctaa 180 
gtcccaacag taacattgcc ccaggaaatc agaccatatc agtatccctc aaagctcaag 240 
tctgtcagtg cagagccata caactaatac ccctacttat agggtaagga atggctacrg 300 
ctacaggaac cagaatagct agtttgttta cttcattatc ctactaccac acactctcaa 360 
atgatttctc agacagtttg caagaaataa cgaaatctat ccttactcta caatcccaaa 420 
tagactcctt ggcagcagtg accctccaaa acggctgagg cctagacctc ctcactgcca 480 
agaaaggagg actctgcatt ttcttagggg aagagtgttt ttacactaac cagtcaggga 540 
cagtatgaga tgccactcgg agtttacagg aaaaggcttc tgaagtcaga caatgcctrt 600 
caaactctat accaaactct ggagttgggc aacatggctt ctcccctttc taggtcccg- 660 
gacagccatc ttgctattat ttgcctttga gccctgtatt tttaatctcc ttttcaaa" 720 
tgtttcctct ggatcgaggc catcgagcta cagatggtct tcacaaatgg aaccccaaa: 780 
gagctcaact aacaacttct actgaggacc cctggactaa cctgctgacc ctttcactcg 840 
cctgaagaat tcccctctgg aggacactac aactgcaggg ctccttcttt gcccctatcr 900 
agcaggaagt agctagagct gtcattgcct aattcctaa 939 



<210> 16 
<211> 979 
<212> ADN 

<213> Homo sapiens 



<400> 16 

agtgataatg 

cagaactaat 

atacagactc 

gggaattcct 

tattggctgt 

gaaaggaaag 

ggctggaccc 

gggaagccaa 

cttccctccc 

accaatagaa 

atgagatggc 

tcagggcctg 

tccctgtatc 

acaaatagtt 

cctggaccag 

aggaaatctc 

gtcatcagcc 



gaatacttga 
agccctcact 
taagtgtgct 
aacttccgag 
acagaaacct 
ggaaatacaa 
tccattagaa 
gccccagtac 
ctccagatgg 
attacttaaa 
caaattatta 
taaagtctgc 
tttaacctcc 
cttcaaatgg 
cctgctagcc 
aactgcacaa 
aacctcccc 



aagtaatccc 
cgggtactag 
tacctagtcc 
ggaacaccta 
aaagaggtgg 
gggagccacc 
atgcttatag 
tcagcaggag 
ctagccacca 
acccttcatc 
tttactggac 
caaagaaata 
ttcttaaatt 
agccacagat 
catgctccaa 
cccctactac 



ctcactcccc 
aatcaggaga 
tccatgccca 
tcaaacatca 
cagttttaca 
aagttgatat 
gaggacccct 
aaatagaata 
ataaaggaaa 
aaaccttcca 
caggcctttt 
atcccctgca 
tgtctcttcc 
gcagtccatg 
tgttaatgac 
gccccaattc 



aggaactagt 
aggaaaaagg 
tgcagcaata 
ggaagccatt 
ctgccggggt 
tgaagtcaaa 
agtatggggt 
gggaacttca 
aatacttttg 
cttaggcatt 
caaaactatc 
ctgcaggcca 
agaatcaaag 
actaagatcc 
atcgaaggca 
agcagaaagc 



gctcagctgg 
gtaaatatat 
tggagagaaa 
aggaaattat 
catcagaaag 
agagccacaa 
aatcccctcc 
tgaggacana 
cctgcagcta 
gatagcaccc 
aagcagatag 
tacatttcaa 
ctgtaaaatt 
accacagacc 
ccccctcctg 
agttagagtg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

979 



<210> 17 
<211> 1774 
<212> ADN 

<213> Homo sapiens 
<400> 17 

catgctggta aaggaccgct agaatccagc agccaggacc actttctttg tggtcaagaa 60 
aggtgggaaa acaggtgcag gactgctaca ctggtaagca taactaatcc gataagcaga 120 
ggtccatggg tggttacgca ccctggaaag gaataagcat taggactata gaggacactc 180 
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taggactaat 

gatgggaaat 

ccaatctgac 

gccacaatat 

caccatctta 

tgtacaaact 

ccctacagga 

aactaataag 

caatgaacca 

atttggccca 

agacctaggt 

acaatccttt 

aaatgaaaaa 

tcaggtcaat 

agttcccagt 

acatttgcta 

ttcaatgatg 

actaagggaa 

aatcttaaag 

gtatgcctta 

ttataataga 

aggtgactgc 

aaagctgagc 

ttaaaaaaga 

ggaatcactg 

accagataat 

ccctcacaga 



gctcatcgga 
gttcccccca 
catcagacac 
cttcttcaag 
cagctagacc 
ttcttttcat 
agccctcaga 
gacccccctt 
aagagtgcca 
gccagcgtgc 
aaattctcag 
gatctgacat 
agtgctgcca 
gataggatga 
gtagaccctc 
acttgcgtgc 
tcccctataa 
ggattgagga 
gataagttta 
ggcccagagc 
gatcaggaag 
tttagtcgtg 
aaattgaatg 
ttgtccaagt 
gaaggcccac 
ccagcagcag 
gccttgggta 



aaatgactag 

aggcagaaat 

taagaaagaa 

gggcagaaac 

tcttttgtag 

taagagataa 

gtctacctcc 

caacccaaat 

atattacacg 

atgtaccttt 

ataaccctga 

ggagagatat 

taacagcagc 

caacagatga 

attaggacac 

tagaaggact 

cacagggaaa 

agcatacctc 

tcactcagtc 

aaaacttaga 

agcaggggaa 

gccctcaggc 

cctaacaggg 

agaaacaagc 

tgccccagga 

gactgaggat 

tgcttgacca 



gggtactggc 

gcccctaaga 

atgactta ta 

czgqcctccz 

aaaagaaggc 

ctcccaatta 

cgaccccagc 

ggtccaaaag 

attatactcg 

ttctctctca 

tggctatatt 

aatgttactg 

ctgagagttt 

aagagaatga 

agaatcagaa 

aaggaaaact 

ggaagaaaau 

cctgtcacct 

agctgcagag 

aaccctactg 

tgggacaaat 

aaatggactt 

cttgcttcta 

tgcccccttg 

gatgaaggtc 

gcccagggca 

ttga 



atccctatgt 
tgtantctgg 
ttcttctgca 
gagggaagra 
aaatggagng 
tgtaaaaagt 
aagaccccaa 
gagatagaca 
ctccaagcag 
gatttaaagc 
gatgttttac 
ctaaatcaga 
ggcgaactct 
ttccccacag 
cttggagatr 
aggaagaagc 
cctactgcc: 
gactctatta 
attaagaaaa 
aact tggcaa 
gggaraaaaa 
tggaggctcc 
gtgtggtcra 
tccatgcccc 
ctctgagtca 
agcgccagcc 



tcttttttca 

agaaatggga 

gtaccacctg 

taaattataa 

aagtgccata 

gtgatttarg 

ctccttctcc 

aaggggtaaa 

tgggaggaga 

aaat taaaat 

aagggttagg 

cactaacccc 

ggtatctcag 

gccagcaggc 

ggtgccacag 

ccatgaatta 

ttctggagag 

aaggccaact 

aacttcaaaa 

cctcagttt t 

aaaaaaaaaa 

agaaaaggga 

caaggacact 

ttatgtcaag 

gaagccacta 

catgccatca 



240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1774 



<210> 18 
<211> 938 
<212> ADN 

<213> Homo sapiens 



<400> 18 

tgtaggaaga 

aaaagacaca 

tgcctaataa 

acttacagaa 

gttttattag 

tgccaaaagt 

tcagacagtt 

ttggtagcag 

gaactctgca 

tgagatactg 

tcttatacca 

gccatcttgc 

tcctctagga 

tcaactaaca 

aagagttccc 

ggaagtagct 



actcccttca 
gtattcagta 
ttggtctgct 
tcaggaagca 
tagcaaagaa 
taacagtgta 
tgcaagaaat 
tgactctcca 
ccttcttagg 
cctgacgttt 
acctctggag 
tattacttgc 
tcaaggccat 
acttctactg 
ttctggagga 
agatcagtca 



ggacaggaca 
agtgataagg 
caaatgtgtg 
gccatctata 
aaattaaaat 
acatgtatta 
aacgtaatct 
aaactgccga 
ggaagagtgc 
acaggaaaag 
ttgggcaaca 
cttcgggccc 
caagctacag 
aggacacctg 
cactacaact 
ttgcccaatt 



atagatggtt 
aaactcttgt 
agttgtttgc 
ccaattctaa 
cccaaactta 
tcctactatc 
atccttactc 
ggtctagacc 
tgtttttaca 
gcttctgaaa 
tggcttctcc 
tgtattttta 
atggtcttac 
gactgaccca 
gcagggcccc 
cccaacag 



cctcccaggr 
agaagcagag 
actcagccaa 
gttaatatgg 
caaggttttc 
acacactctc 
tacagtccca 
tcctcaatgc 
ctaaccagtc 
tcagacaacg 
ccttgctagg 
acctccttgt 
aaatggaacc 
ctggcccttt 
gtcttcaccc 



gattaaggaa 60 
ttagaaaaat 120 
atcttaaagt 180 
actaaacgag 240 
aactaaagtt 300 
aaaggatttc 360 
aatagactct 420 
tgagaaagga 4 80 
agggatagta 54 0 
cctttcaagc 600 
tcctgtggca 660 
caaatttgtt 720 
ccaaatgagc 780 
cactggccta 840 
ctatccagca 900 
938 



<210> 19 
<211> 1308 
<212> ADN 

<213> Homo sapiens 
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<400> 19 

gatgcttgcc ccaggcaccc tcagtcctgt 
ccaaagaacc tttgtcctct gaggcagtgc 
catgggcaag ggggcagctt gtttctcact 
ccacactggt aacaagccct accaggtgat 
ccaccaaggt ttgtctgtct gagggtcatg 
ttttcctttt tggcctgttc ctcttggtac 
aacaatggct ccagattttg ttcagggcac 
ctgcagctga ttgggtaata aacttatctt 
gtgacagggg agtatatttc cttgaggcct 
tttcttcctt tccctgagtt ataaaagaca 
ttctccgtag tccttctaga acacaggtca 
ctgagtctag acaccagtgg ggatccatac 
tgtccctttc tttggctgtc attctatcat 
attctcaggc tgcagctaaa gctgcattct 
gcatgacatc tctccaagtg aggtcaaagg 
ggagaagggg acatacacct gagttagcca 
cataagcaat agcctgggga tttttgtggt 
tgggtggggg agattagagg aggcttatca 
ggatatgggg gtaagctgag aggtcatctt 
tgtggatttt ccttacaatg aaaataaagc 
ttccctctta cagaaaaggt caagctgcag 
tggccatttc ttcccatcag agagagaata 



14 



tgttggatca tctggtcggg ggcttctggc 60 
accttccagt gattgcctca gcattgrgga 120 
ggacaatctt ttttaaggtg tccttccaaa 180 
nggcctgctc tattttctgt cctctctgaa 240 
actaaggctg tggcctttct ctgatcttgc 300 
ctattataga acactgaggt tgccaggttt 360 
agggctcatt ttggagcttt ctcctgatat 420 
ttaggatcaa trgactctca agagagttgg 480 
cccatagccg ctctaggaag gcagaaggat 540 
tcattgaaca actcatggac tttttcccaa 600 
gcagatgttt acgactccag tccccatgat 660 
tggggatggc ctgctgactg gtagggaatt 720 
ttacttgact aagataccaa gtatctccaa 780 
tttcattaaa ggccagggtt tgatctaata 840 
tttgccctag atccatagga catcagagaa 900 
aattcccctc cctctacagc ttgaagggga 960 
cctttggaga tttctttgct tgtttccttc 1020 
gtaataggaa ggggagctat agggaggcta 1080 
gtgggatgta aartgcaagc tttgcatagt 1140 
ttggacataa ggtanrtcac tccatttgcc 1200 
gatagtactg taatttatac tcccttcagg 1260 
ctggggctgg gccatagt 1308 



<210> 20 
<211> 711 
<212> ADN 

<213> Homo sapiens 
<400> 20 

actgagagac aggactagct ggatttccta 

gaaggtgacc acgtccacct ttaaacacgg 

cagagagctc actaaaatgc taattaggca 

ctattgcctg agagcacagc aggagggaca 

ctggcaacag cagcccccct ttgggtccct 

tttcactcta ttaaatcttg caactgcact 

tgagcttttg ctcaccgtcc accactgctg 

cccatccctc tggatcctgc agggtgtccg 

gccgctccca attgggctaa aggcttgcca 

gttctaattg agctgaacac tagtcactgg 

ttctaataga actataacac ttaccacatg 

ggccaagaac tccaggtcag agaatacgag 



ggccgactaa gaatccctaa gcctagctgg 60 
ggcttgcaac ttagctcaca cctgaccaat 120 
aagacaggag gtaaagaaat agccaatcat 180 
acaatcggga tataaaccca ggcattcgag 240 
tccctttgta tgggagctgt tttcatgcta 300 
cttctggtcc atgtttctta cggctcgagc 360 
tttgccacca ccgcagacct gccgctgact 420 
ctgtgctcct gatccagcga ggcgcccatt 4 80 
ttgttcctgc acggctaagt gcctgggttt 540 
gttccatggt tctcttctgt gacccacggc 600 
gcccaagatt ccattccttg gaatccgtga 660 
gcttgccacc atcttggaag c 711 



<210> 21 
<211> 711 
<212> ADN 

<213> Homo sapiens 
<400> 21 

actgagagac aggactagct ggatttccta 
gaaggtgacc acatccacct ttaaacacgg 
cagagagctc actaaaatgc taattaggca 
ctattgcctg agagcacagc aggagggaca 
ccggcaacgg caaccccctt tgggtcccct 
atttcactct attaaatctt gcaactgcac 
ctgagctttc gctcgccatc caccactgct 



ggctgactaa gaatccctaa gcctagctgg 60 
ggcttgcaac ttagctcaca cctgaccaat 120 
aagacaggag gtaaagaaat agccaatcat 180 
atgatcggga tataaaccca agtcttcgag 240 
ccctttgtat gggagctctg ttttcatgct 300 
tcttctggtc catgtttctt acggcttgag 360 
gtttgccgcc accgcagacc cgccgctgac 420 
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tcccatccct ctggatcatg 
tgccgctccc aatcgggcta 
catcctaatt gagctgaaca 
cttctaatag agctataaca 
ggccaagaac cccaggtcag 



cagggtgtcc gctgtgctcc tgatccagcg 
aaggcttgcc attgttcctg catggctaag 
ctagtcactg ggttccatgg ttctcttctg 
ctcaccgcat ggcccaaggt tccattcctt 
agaacacgag gcttgccacc atcttgggag 



aggcacccat 480 
tgcctgggtt 54 0 
tgacccacag 600 
gaatccataa 660 
c 711 



<210> 22 
<211> 2055 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (2055) 

<400> 22 

ccc aag aca gcc aac tta gtt gca gac ate acc tec tta gec aaa tat 48 

Pro Lys Thr Ala Asn Leu Val Ala Asp lie Thr Ser Leu Ala Lys Tyr 

15 10 15 

caa caa gtt ctt aaa aca tta caa gga acc tat ccc tga gaa gag gga 96 
Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro Glu Glu Gly 

20 25 30 

aaa gaa eta ttc cac cct tgt gac atg gta tta gtc aag tec ctt ccc 144 
Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys Ser Leu Pro 
35 40 45 

tct aat tec cca tec eta gat aca tec tgg gaa gga ccc tac cca gtc 192 
Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro Tyr Pro Val 
50 55 60 

att tta tct acc cca act gcg gtt aaa gtg get gga gtg gag tct tgg 240 
lie Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val Glu Ser Trp 
65 70 75 80 

ata cat cac act tga gtc aaa tec tgg ata ctg cca aag gaa cct gaa 288 
lie His His Thr Val Lys Ser Trp lie Leu Pro Lys Glu Pro Glu 

85 90 95 

aat cca gga gac aac get age tat tec tgt gaa cct eta gag gat ttg 336 
Asn Pro Gly Asp Asn Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu 
100 105 110 

cgc ctg etc ttc aaa caa caa cca gga gga aag taa eta aaa tea taa 384 
Arg Leu Leu Phe Lys Gin Gin Pro Gly Gly Lys Leu Lys Ser 

115 120 125 

ate ccc atg gcc etc cct tat cat att ttt etc ttt act gtt ctt tta 4 32 
lie Pro Met Ala Leu Pro Tyr His lie Phe Leu Phe Thr Val Leu Leu 
130 135 140 



ccc tct ttc act etc act gca ccc cct cca tgc cgc tgt atg acc agt 
Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
145 150 155 160 



480 
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age tec cct tac caa gag ttt eta tgg aga atg cag cgt ccc gga aat 528 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
165 170 175 

att gat gec cca teg tat agg agt ctt tct aag gga acc ccc acc ttc 576 
lie Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
180 185 190 

act gee cac acc cat atg ccc cgc aac tgc tat cac tct gec act ctt 624 
Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
195 200 205 

tgc atg cat gca aat act cat tat tgg aca gga aaa atg att aat cct 672 
Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro 
210 215 220 

agt tgt cct gga gga ctt gga gtc act gtc tgt tgg act tac ttc acc 720 
Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
225 230 235 240 

caa act ggt atg tct gat ggg ggt gga gtt caa gat cag gca aga gaa 7 68 
Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
245 250 255 

aaa cat gta aaa gaa gta ate tec caa etc acc egg gta cat ggc acc 816 
Lys His Val Lys Glu Val lie Ser Gin Leu Thr Arg Val His Gly Thr 
260 265 270 

tct age ccc tac aaa gga eta gat etc tea aaa eta cat gaa acc etc 864 
Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
275 280 285 

cgt acc cat act cgc ctg gta age eta ttt aat acc acc etc act ggg 912 
Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
290 295 300 

etc cat gag gtc teg gee caa aac cct act aac tgt tgg ata tgc etc 960 
Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp lie Cys Leu 
305 310 315 320 

ccc ctg aac ttc agg cca tat gtt tea ate cct gta cct gaa caa tgg 1008 
Pro Leu Asn Phe Arg Pro Tyr Val Ser lie Pro Val Pro Glu Gin Trp 
325 330 335 

aac aac ttc age aca gaa ata aac acc act tec gtt tta gta gga cct 1056 
Asn Asn Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro 
340 345 350 

ctt gtt tec aat ctg gaa ata acc cat acc tea aac etc acc tgt gta 1104 
Leu Val Ser Asn Leu Glu lie Thr His Thr Ser Asn Leu Thr Cys Val 
355 360 365 

aaa ttt age aat act aca tac aca acc aac tec caa tgc ate agg tgg 1152 
Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys lie Arg Trp 
370 375 380 
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gta act cct ccc aca caa ata gtc tgc eta ccc tea gga ata ttt ttt 1200 

Val Thr Pro Pro Thr Gin lie Val Cys Leu Pro Ser Gly lie Phe ?he 
385 390 395 400 

gtc tgt ggt acc tea gec tat cgt tgt ttg aat ggc tct tea gaa tct 1248 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
405 410 ' 415 

atg tgc ttc etc tea ttc tta gtg ccc cct atg acc ate tac act gaa 1296 

Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr lie Tvr Thr Glu 
420 425 430 

caa gat tta tac agt tat gtc ata tct aag ccc cgc aac aaa aga gta 1344 

Gin Asp Leu Tyr Ser Tyr Val lie Ser Lys Pro Arg Asn Lys Arg Val 

435 440 445 

ccc att ctt cct ttt gtt ata gga gca gga gtg eta ggt gca eta ggt 12 92 

Pro lie Leu Pro Phe Val lie Gly Ala Gly Val Leu Gly Ala Leu Gly 
450 455 460 

act ggc att ggc ggt ate aca acc tct act cag ttc tac tac aaa eta 1440 

Thr Gly lie Gly Gly lie Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
465 470 475 480 

tct caa gaa eta aat ggg gac atg gaa egg gtc gee gac tec ctg gtc 1488 

Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
485 490 495 

acc ttg caa gat caa ctt aac tec eta gca gca gta gtc ctt caa aat 1536 

Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
500 505 510 

cga aga get tta gac ttg eta acc get gaa aga ggg gga acc tgt tta 1584 

Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 

515 520 525 

ttt tta ggg gaa gaa tgc tgt tat tat gtt aat caa tec gga ate gtc 1632 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly lie Val 
530 535 540 

act gag aaa gtt aaa gaa att cga gat cga ata caa cgt aga gca gag 1680 

Thr Glu Lys Val Lys Glu lie Arg Asp Arg lie Gin Arg Arg Ala Glu 
545 550 555 560 

gag ctt cga aac act gga ccc tgg ggc etc etc age caa tgg atg ccc 1728 

Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Trp Met Pro 
565 570 575 

tgg att etc ccc ttc tta gga cct eta gca get ata ata ttg eta etc 1776 

Trp lie Leu Pro Phe Leu Gly Pro Leu Ala Ala lie lie Leu Leu Leu 
580 585 590 

etc ttt gga ccc tgt ate ttt aac etc ctt gtt aac ttt gtc tct tec 1824 

Leu Phe Gly Pro Cys lie Phe Asn Leu Leu Val Asn Phe Val Ser Ser 

595 600 605 
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aga ate gaa get gta aaa eta caa atg gag ccc aag atg cag tec aag 1872 

Arg lie Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lvs 

610 615 620 

act aag ate tac cgc aga ccc ctg gac egg cct get age cca cga tct 1920 

Thr Lys lie Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 

625 630 635 640 

gat gtt aat gac ate aaa ggc acc cct cct gag gaa ate tea get gca 1968 

Asp Val Asn Asp lie Lys Gly Thr Pro Pro Glu Glu lie Ser Ala Ala 
645 650 655 

caa cct eta eta cgc ccc aat tea gca gga age agt tag age ggt cgt 2016 

Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser Ser Gly Arg 

660 665 670 

egg cca acc tec cca aca gca ctt agg ttt tec tgt tga 2055 

Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys 

675 680 685 



<210> 23 
<211> 28 
<212> PRT 

<213> Homo sapiens 
<400> 23 

Pro Lys Thr Ala Asn Leu Val Ala Asp lie Thr Ser Leu Ala Lys Tyr 
15 10 15 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tyr Pro 
20 25 



<210> 24 
<211> 55 
<212> PRT 

<213> Homo sapiens 
<400> 24 

Glu Glu Gly Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys 
15 10 15 

Ser Leu Pro Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro 
20 25 30 

Tyr Pro Val lie Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val 
35 40 45 

Glu Ser Trp lie His His Thr 
50 55 



<210> 25 
<211> 38 
<212> PRT 
<213> Homo 



sapiens 
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<400> 25 

Val Lys Ser Trp lie Leu Pro Lys Glu Pro Glu Asn Pro Gly Asp Asn 
15 10 15 

Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu Arg Leu Leu Phe Lys 
20 25 " 30 

Gin Gin Pro Gly Gly Lys 
35 



<210> 26 
<211> 540 
<212> PRT 

<213> Homo sapiens 
<400> 26 

lie Pro Met Ala Leu Pro Tyr His lie Phe Leu Phe Thr Val Leu Leu 
15 10 15 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
20 25 30 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
35 40 45 

lie Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
50 55 60 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
65 70 75 80 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro 
85 90 95 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
100 105 110 

Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
115 120 125 

Lys His Val Lys Glu Val lie Ser Gin Leu Thr Arg Val His Gly Thr 
130 135 140 

Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
145 150 155 160 

Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Gly 
165 170 175 

Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cys Trp lie Cys Leu 
180 185 190 

Pro Leu Asn Phe Arg Pro Tyr Val Ser lie Pro Val Pro Glu Gin Trp 
195 200 205 



Asn Asn Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro 
210 215 220 
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Leu Val Ser Asn Leu Glu 
225 230 

Lys Phe Ser Asn Thr Thr 
245 

Val Thr Pro Pro Thr Gin 
260 

Val Cys Gly Thr Ser Ala 
275 

Met Cys Phe Leu Ser Phe 
290 

Gin Asp Leu Tyr Ser Tyr 
305 310 

Pro lie Leu Pro Phe Val 
325 

Thr Gly He Gly Gly He 
340 

Ser Gin Glu Leu Asn Gly 
355 

Thr Leu Gin Asp Gin Leu 
370 

Arg Arg Ala Leu Asp Leu 
385 390 

Phe Leu Gly Glu Glu Cys 
405 

Thr Glu Lys Val Lys Glu 
420 

Glu Leu Arg Asn Thr Gly 
435 

Trp He Leu Pro Phe Leu 
450 

Leu Phe Gly Pro Cys He 
465 470 

Arg lie Glu Ala Val Lys 
485 

Thr Lys He Tyr Arg Arg 
500 

Asp Val Asn Asp He Lys 
515 



He Thr His Thr Ser 
235 

Tyr Thr Thr Asn Ser 
250 



He Val Cys Leu Pro 
265 

Tyr Arg Cys Leu Asn 
280 

Leu Val Pro Pro Met 
295 

Val He Ser Lys Pro 
315 

He Gly Ala Gly Val 
330 

Thr Thr Ser Thr Gin 
345 



Asp Met Glu Arg Val 
360 



Asn Ser Leu Ala Ala 
375 

Leu Thr Ala Glu Arg 
395 

Cys Tyr Tyr Val Asn 
410 

He Arg Asp Arg He 
425 

Pro Trp Gly Leu Leu 
440 

Gly Pro Leu Ala Ala 
455 

Phe Asn Leu Leu Val 
475 

Leu Gin Met Glu Pro 
490 

Pro Leu Asp Arg Pro 
505 

Gly Thr Pro Pro Glu 
520 



Asn Leu Thr Cys Val 
240 

Gin Cys lie Arg Trp 

255 

Ser Gly lie Phe Phe 
270 

Gly Ser Ser Glu Ser 
285 

Thr lie Tyr Thr Glu 
300 



Arg Asn Lys Arg Val 
320 

Leu Gly Ala Leu Gly 
335 

Phe Tyr Tyr Lys Leu 
350 



Ala Asp Ser Leu Val 
365 

Val Val Leu Gin Asn 
380 

Gly Gly Thr Cys Leu 
400 

Gin Ser Gly He Val 
415 

Gin Arg Arg Ala Glu 
430 

Ser Gin Trp Met Pro 
445 

lie lie Leu Leu Leu 
460 

Asn Phe Val Ser Ser 
480 

Lys Met Gin Ser Lys 
495 

Ala Ser Pro Arg Ser 
510 

Glu He Ser Ala Ala 
525 
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Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser 
530 535 540 



<210> 27 
<211> 15 
<212> PRT 

<213> Homo sapiens 
<400> 27 

Ser Gly Arg Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys 
15 10 15 



<210> 28 
<211> 1080 
<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (1080) 

<400> 28 

acc tct ttt gta gaa aag gca aat gga gtg aag tgc cat aag tac aaa 48 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

ctt tct ttt cat taa gag aca act cac aat tat gta aaa agt gtg att 96 
Leu Ser Phe His Glu Thr Thr His Asn Tyr Val Lys Ser Val lie 

20 25 30 

tat gcc eta cag gaa gec ttc aga gtc tac etc cct ate cca gca tec 144 
Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro lie Pro Ala Ser 
35 40 45 

ccg act cct tec cca act aat aag gac ccc cct tea acc caa atg gtc 192 
Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val 
50 55 60 

caa aag gag ata gac aaa agg gta aac agt gaa cca aag agt gcc aat 240 
Gin Lys Glu lie Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn 
65 70 75 80 

att ccc caa tta tga ccc etc caa gca gtg gga gga aga gaa ttc ggc 288 
lie Pro Gin Leu Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly 

85 90 95 

cca gcc aga gtg cat gtg cct ttt tct etc cca gac tta aag caa ata 336 
Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin lie 
100 105 110 

aaa aca gac tta ggt aaa ttc tea gat aac cct gat ggc tat att gat 384 
Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr lie Asp 
115 120 125 
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gtt tta caa ggg tta gga caa ttc ttt gat ctg aca tgg aga gat ata 432 
Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp lie 
130 135 140 

atg tea ctg eta aat cag aca eta ace cca aat gag aga agt gec acc 480 
Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Thr 
145 150 155 160 

ata act gca gec tga gag ttt ggc gat etc tgg tat etc agt cag gtc 523 
lie Thr Ala Ala Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val 

165 170 175 

aat gat agg atg aca aca gag gaa aga gaa tga ttc ccc aca ggc cag 576 
Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Phe Pro Thr Gly Gin 

180 185 190 

cag gca gtt ccc agt eta gac cct cat tgg gac aca gaa tea gaa cat 624 
Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu His 
195 200 205 

gga gat tgg tgc tgc aga cat ttg eta act tgt gtg eta gaa gga eta 672 
Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly Leu 
210 215 220 

agg aaa act agg aag aag tct atg aat tac tea atg atg tec acc ata 720 
Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr lie 
225 230 235 240 

aca cag gga agg gaa gaa aat cct act gec ttt ctg gag aga eta agg 7 68 
Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu Arg 
245 250 255 

gag gca ttg agg aag cgt gec tct ctg tea cct gac tct tct gaa ggc 816 
Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu Gly 
260 265 270 

caa eta ate tta aag cgt aag ttt ate act cag tea get gca gac att 864 
Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp lie 
275 280 285 

aga aaa aaa ctt caa aag tct gec gta ggc ccg gag caa aac tta gaa 912 
Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu Glu 
290 295 300 

acc eta ttg aac ttg gca acc teg gtt ttt tat aat aga gat cag gag 960 
Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin Glu 
305 310 315 320 

gag cag gcg gaa cag gac aaa egg gat taa aaa aaa ggc cac cgc ttt 1008 
Glu Gin Ala Glu Gin Asp Lys Arg Asp Lys Lys Gly His Arg Phe 

325 330 335 

agt cat gac cct cag gca agt gga ctt tgg agg etc tgg aaa agg gaa 1056 
Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg Glu 
340 345 350 
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aag ctg ggc aaa ttg aat gcc taa 1080 
Lys Leu Gly Lys Leu Asn Ala 

355 360 



<210> 29 
<211> 20 
<212> PRT 

<213> Homo sapiens 
<400> 29 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lvs Tyr Lys 
15 10 15 

Leu Ser Phe His 
20 



<210> 30 
<211> 63 
<212> PRT 

<213> Homo sapiens 
<400> 30 

Glu Thr Thr His Asn Tyr Val Lys Ser Val lie Tyr Ala Leu Gin Glu 
15 10 15 

Ala Phe Arg Val Tyr Leu Pro lie Pro Ala Ser Pro Thr Pro Ser Pro 
20 25 30 

Thr Asn Lys Asp Pro Pro Ser Thr Gin Met Val Gin Lys Glu lie Asp 
35 40 45 

Lys Arg Val Asn Ser Glu Pro Lys Ser Ala Asn lie Pro Gin Leu 
50 55 60 



<210> 31 
<211> 79 
<212> PRT 

<213> Homo sapiens 
<400> 31 

Pro Leu Gin Ala Val Gly Gly Arg Glu Phe Gly Pro Ala Arg Val His 
15 10 15 

Val Pro Phe Ser Leu Pro Asp Leu Lys Gin lie Lys Thr Asp Leu Gly 
20 25 30 

Lys Phe Ser Asp Asn Pro Asp Gly Tyr lie Asp Val Leu Gin Gly Leu 
35 40 45 

Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp lie Met Ser Leu Leu Asn 
50 55 60 

Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Thr lie Thr Ala Ala 
65 70 75 
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<210> 32 
<211> 21 
<212> PRT 

<213> Homo sapiens 
<400> 32 

Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val Asn Asp Arg Met Thr 
15 10 15 

Thr Glu Glu Arg Glu 
20 



<210> 33 
<211> 142 
<212> PRT 

<213> Homo sapiens 
<400> 33 

Phe Pro Thr Gly Gin Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp 
15 10 15 

Thr Glu Ser Glu His Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys 
20 25 30 

Val Leu Glu Gly Leu Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser 
35 40 45 

Met Met Ser Thr lie Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe 
50 55 60 

Leu Glu Arg Leu Arg Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro 
65 70 75 80 

Asp Ser Ser Glu Gly Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin 
85 90 95 

Ser Ala Ala Asp lie Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro 
100 105 110 

Glu Gin Asn Leu Glu Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr 
115 120 125 

Asn Arg Asp Gin Glu Glu Gin Ala Glu Gin Asp Lys Arg Asp 
130 135 140 



<210> 34 
<211> 29 
<212> PRT 

<213> Homo sapiens 
<400> 34 

Lys Lys Gly His Arg Phe Ser His Asp Pro Gin Ala Ser Gly Leu Trp 
15 10 15 
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Arg Leu Trp Lys Arg Glu Lys Leu Gly Lys Leu Asn Ala 
20 25 



<210> 35 
<211> 685 
<212> PRT 

<213> Homo sapiens 
<400> 35 

Pro Lys Thr Ala Asn Leu Val Ala Asp lie Thr Ser Leu Ala Lys Tyr 
15 10 15 

Gin Gin Val Leu Lys Thr Leu Gin Gly Thr Tvr Pro Xaa Glu Glu Gly 
20 25 30 

Lys Glu Leu Phe His Pro Cys Asp Met Val Leu Val Lys Ser Leu Pro 
35 40 45 

Ser Asn Ser Pro Ser Leu Asp Thr Ser Trp Glu Gly Pro Tyr Pro Val 
50 55 60 

lie Leu Ser Thr Pro Thr Ala Val Lys Val Ala Gly Val Glu Ser Trp 
65 70 75 80 

lie His His Thr Xaa Val Lys Ser Trp lie Leu Pro Lys Glu Pro Glu 
85 90 95 

Asn Pro Gly Asp Asn Ala Ser Tyr Ser Cys Glu Pro Leu Glu Asp Leu 
100 105 110 

Arg Leu Leu Phe Lys Gin Gin Pro Gly Gly Lys Xaa Leu Lys Ser Xaa 
115 120 125 

lie Pro Met Ala Leu Pro Tyr His lie Phe Leu Phe Thr Val Leu Leu 
130 135 140 

Pro Ser Phe Thr Leu Thr Ala Pro Pro Pro Cys Arg Cys Met Thr Ser 
145 150 155 160 

Ser Ser Pro Tyr Gin Glu Phe Leu Trp Arg Met Gin Arg Pro Gly Asn 
165 170 175 

lie Asp Ala Pro Ser Tyr Arg Ser Leu Ser Lys Gly Thr Pro Thr Phe 
180 185 190 

Thr Ala His Thr His Met Pro Arg Asn Cys Tyr His Ser Ala Thr Leu 
195 200 205 

Cys Met His Ala Asn Thr His Tyr Trp Thr Gly Lys Met lie Asn Pro 
210 215 220 

Ser Cys Pro Gly Gly Leu Gly Val Thr Val Cys Trp Thr Tyr Phe Thr 
225 230 235 240 

Gin Thr Gly Met Ser Asp Gly Gly Gly Val Gin Asp Gin Ala Arg Glu 
245 250 255 
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Lys His Val Lys Glu Val lie Ser Gin Leu Thr Arg Val His Gly Thr 
260 265 270 

Ser Ser Pro Tyr Lys Gly Leu Asp Leu Ser Lys Leu His Glu Thr Leu 
275 280 " 285 

Arg Thr His Thr Arg Leu Val Ser Leu Phe Asn Thr Thr Leu Thr Glv 
290 295 300 

Leu His Glu Val Ser Ala Gin Asn Pro Thr Asn Cvs Trp lie Cys Leu 
305 310 315 320 

Pro Leu Asn Phe Arg Pro Tyr Val Ser lie Pro Val Pro Glu Gin Trp 
325 330 335 

Asn Asn Phe Ser Thr Glu lie Asn Thr Thr Ser Val Leu Val Gly Pro 
340 345 350 

Leu Val Ser Asn Leu Glu lie Thr His Thr Ser Asn Leu Thr Cys Val 
355 360 365 

Lys Phe Ser Asn Thr Thr Tyr Thr Thr Asn Ser Gin Cys lie Arg Trp 
370 375 380 

Val Thr Pro Pro Thr Gin lie Val Cys Leu Pro Ser Gly lie Phe Phe 
385 390 395 400 

Val Cys Gly Thr Ser Ala Tyr Arg Cys Leu Asn Gly Ser Ser Glu Ser 
405 410 415 

Met Cys Phe Leu Ser Phe Leu Val Pro Pro Met Thr lie Tyr Thr Glu 
420 425 430 

Gin Asp Leu Tyr Ser Tyr Val lie Ser Lys Pro Arg Asn Lys Arg Val 
435 440 445 

Pro lie Leu Pro Phe Val lie Gly Ala Gly Val Leu Gly Ala Leu Gly 
450 455 460 

Thr Gly lie Gly Gly lie Thr Thr Ser Thr Gin Phe Tyr Tyr Lys Leu 
465 470 475 480 

Ser Gin Glu Leu Asn Gly Asp Met Glu Arg Val Ala Asp Ser Leu Val 
4 85 4 90 4 95 

Thr Leu Gin Asp Gin Leu Asn Ser Leu Ala Ala Val Val Leu Gin Asn 
500 505 510 

Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly Thr Cys Leu 
515 520 525 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val Asn Gin Ser Gly lie Val 

530 535 540 



Thr Glu Lys Val Lys Glu lie Arg Asp Arg lie Gin Arg Ara Ala Glu 
545 550 555 " 560 
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Glu Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu Ser Gin Tro Met Pro 
565 570 " 575 

Trp lie Leu Pro Phe Leu Gly Pro Leu Ala Ala lie lie Leu Leu Leu 
580 585 590 

Leu Phe Gly Pro Cys lie Phe Asn Leu Leu Val Asn Phe Val Ser Ser 
595 600 605 

Arg lie Glu Ala Val Lys Leu Gin Met Glu Pro Lys Met Gin Ser Lys 
610 615 620 

Thr Lys lie Tyr Arg Arg Pro Leu Asp Arg Pro Ala Ser Pro Arg Ser 
625 630 635 640 

Asp Val Asn Asp lie Lys Gly Thr Pro Pro Glu Glu lie Ser Ala Ala 
645 650 655 

Gin Pro Leu Leu Arg Pro Asn Ser Ala Gly Ser Ser Xaa Ser Gly Arg 
660 665 670 

Arg Pro Thr Ser Pro Thr Ala Leu Arg Phe Ser Cys Xaa 
675 680 685 



<210> 36 
<211> 360 
<212> PRT 

<213> Homo sapiens 
<400> 36 

Thr Ser Phe Val Glu 
1 5 

Leu Ser Phe His Xaa 
20 

Tyr Ala Leu Gin Glu 
35 

Pro Thr Pro Ser Pro 
50 

Gin Lys Glu lie Asp 
65 

lie Pro Gin Leu Xaa 
85 

Pro Ala Arg Val His 
100 



Lys Thr Asp Leu Gly 
115 



Lys Ala Asn Gly Val Lys 
10 

Glu Thr Thr His Asn Tyr 
25 

Ala Phe Arg Val Tyr Leu 
40 



Thr Asn Lys Asp Pro Pro 
55 

Lys Arg Val Asn Ser Glu 
70 75 

Pro Leu Gin Ala Val Gly 
90 

Val Pro Phe Ser Leu Pro 
105 



Lys Phe Ser Asp Asn Pro 
120 



Cys His Lys Tyr Lys 
15 

Val Lys Ser Val lie 
30 

Pro lie Pro Ala Ser 
45 



Ser Thr Gin Met Val 
60 

Pro Lys Ser Ala Asn 
80 

Gly Arg Glu Phe Gly 
95 

Asp Leu Lys Gin lie 
110 



Asp Gly Tyr lie Asp 
125 



Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp lie 
130 135 140 
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Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala Thr 
145 150 155 160 

lie Thr Ala Ala Xaa Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin Val 
165 170 175 

Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Xaa Phe Pro Thr Gly Gin 
180 185 190 

Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu His 
195 200 205 

Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly Leu 
210 215 220 

Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr lie 
225 230 235 240 

Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu Arg 
245 250 255 

Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Asp Ser Ser Glu Gly 
260 265 270 

Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp lie 
275 280 285 

Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu Glu 
290 295 300 

Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin Glu 
305 310 315 320 

Glu Gin Ala Glu Gin Asp Lys Arg Asp Xaa Lys Lys Gly His Arg Phe 
325 330 335 

Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lys Arg Glu 
340 345 350 



Lys Leu Gly Lys Leu Asn Ala Xaa 
355 360 



<210> 37 
<211> 26 
<212> ADN 

<213> Homo sapiens 
<400> 37 

ggaccataga ggacactcca ggacta 26 



<210> 38 
<211> 25 
<212> ADN 

<213> Homo sapiens 
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<400> 38 

cctcagtcct gctgctggat catct 



25 



<210> 39 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 39 

cctccaagca gtgggaggaa gagaatt 27 

<210> 40 
<211> 28 
<212> ADN 

<213> Homo sapiens 



<210> 41 
<211> 30 
<212> ADN 

<213> Homo sapiens 
<400> 41 

ggaagaagtc tatgaattat tcaatgatgt 30 



<210> 42 

<211> 27 

<212> ADN 

<213> Homo sapiens 



<210> 43 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 43 

gccttcagaa gagtcaggtg acagaga 27 

<210> 44 
<211> 25 
<212> ADN 

<213> Homo sapiens 



<400> 40 

ccttccctgt gttattgtgg acatcatt 



28 



<400> 42 



gggacacaga atcagaacat ggagatt 



27 



<400> 44 

gagcctccaa agtccacttg cctga 



25 
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<210> 45 
<211> 29 
<212> ADN 

<213> Homo sapiens 
<400> 45 

gatttcagta tctactagtc tgggtagat 29 



<210> 46 
<211> 27 
<212> ADN 

<213> Homo sapiens 



<210> 47 
<211> 28 
<212> ADN 

<213> Homo sapiens 
<400> 47 

ccaagacagc caacttagtt gcagacat 28 



<210> 48 
<211> 28 
<212> ADN 

<213> Homo sapiens 



<210> 49 
<211> 29 
<212> ADN 

<213> Homo sapiens 
<400> 49 

gcaatactac atacacaacc aactcccaa 29 



<210> 50 
<211> 26 
<212> ADN 

<213> Homo sapiens 



<400> 46 

ctaggaaatc cagctagtcc tgtctca 



27 



<400> 48 

ggacgctgca ttctccatag aaactctt 



28 



<400> 50 

gggggaggca tatccaacag ttagta 



26 
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<210> 51 
<211> 30 
<212> ADN 

<213> Homo sapiens 
<400> 51 

ccatctacac tgaacaagat ttatacactt 30 



<210> 52 

<211> 28 

<212> ADN - 

<213> Homo sapiens 



<210> 53 
<211> 31 
<212> ADN 

<213> Homo sapiens 
<400> 53 

cgaatacaac gtagagcaga ggagcttcga a 31 

<210> 54 
<211> 28 
<212> ADN 

<213> Homo sapiens 



<210> 55 
<211> 27 
<212> ADN 

<213> Homo sapiens 
<400> 55 

gcgtagtaga ggttgtgcag ctgagat 27 



<210> 56 
<211> 27 
<212> ADN 

<213> Homo sapiens 



<400> 52 

aatgccagta cctagtgcac ctagcact 



28 



<400> 54 

agcccaagat gcagtccaag actaagat 



28 



<400> 56 

cccttaccaa gagtttctat ggagaat 



27 



<210> 57 
<211> 27 
<212> ADN 



<213> Homo sapiens 
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<400> 57 

accgctctaa ctgcttcctg ctgaatt 27 

<210> 58 
<211> 420 
<212> PRT 

<213> Homo sapiens 
<400> 58 

Thr Ser Phe Val Glu Lys Ala Asn Gly Val Lys Cys His Lys Tyr Lys 
15 10 15 

Leu Ser Phe His Xaa Glu Thr Thr His Asn Tyr Val Lys Ser Val lie 
20 25 30 



Tyr Ala Leu Gin Glu Ala Phe Arg Val Tyr Leu Pro Ile\Leu/Pro Ala 
35 40 45 - — 1 

Ser Pro Thr Pro Ser Pro Thr Asn Lys Asp Pro Pro Ser Thr Gin Met 
50 55 60 

Val Gin Lys Glu lie Asp Lys Arg Val Asn Ser Glu Pro Lys Ser Ala 
65 70 75 80 

Asn lie Pro Gin Leu Xaa Pro Leu Gin Ala Val Gly Gly Arg Glu Phe 
85 90 95 

Gly Pro Ala Arg Val His Val Pro Phe Ser Leu Pro Asp Leu Lys Gin 
100 105 110 

lie Lys Thr Asp Leu Gly Lys Phe Ser Asp Asn Pro Asp Gly Tyr lie 
115 120 125 

Asp Val Leu Gin Gly Leu Gly Gin Phe Phe Asp Leu Thr Trp Arg Asp 
130 135 140 

lie Met Ser Leu Leu Asn Gin Thr Leu Thr Pro Asn Glu Arg Ser Ala 
145 150 155 160 

Thr lie Thr Ala Ala Xaa Glu Phe Gly Asp Leu Trp Tyr Leu Ser Gin 
165 170 175 

Val Asn Asp Arg Met Thr Thr Glu Glu Arg Glu Xaa Phe Pro Thr Gly 
180 185 190 

Gin Gin Ala Val Pro Ser Leu Asp Pro His Trp Asp Thr Glu Ser Glu 
195 200 205 

His Gly Asp Trp Cys Cys Arg His Leu Leu Thr Cys Val Leu Glu Gly 
210 215 220 

Leu Arg Lys Thr Arg Lys Lys Ser Met Asn Tyr Ser Met Met Ser Thr 
225 230 235 240 

lie Thr Gin Gly Arg Glu Glu Asn Pro Thr Ala Phe Leu Glu Arg Leu 
245 250 255 
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Arg Glu Ala Leu Arg Lys Arg Ala Ser Leu Ser Pro Aso Ser Ser Glu 
260 265 * 270 

Gly Gin Leu lie Leu Lys Arg Lys Phe lie Thr Gin Ser Ala Ala Asp 
275 280 285 

lie Arg Lys Lys Leu Gin Lys Ser Ala Val Gly Pro Glu Gin Asn Leu 
290 295 300 

Glu Thr Leu Leu Asn Leu Ala Thr Ser Val Phe Tyr Asn Arg Asp Gin 
305 310 315 320 

Glu Glu Gin Ala Glu Gin Asp Lys Arg Asp Xaa Lys Lys Gly His Arg 
325 330 335 

Phe Ser His Asp Pro Gin Ala Ser Gly Leu Trp Arg Leu Trp Lvs Arg 
340 345 350 

Glu Lys Leu Gly Lys Leu Asn Ala Xaa Xaa Gly Leu Leu Pro Val Arg 
355 360 365 

Ser Thr Arg Thr Leu Xaa Lys Arg Leu Ser Lys Xaa Lys Xaa Ala Ala 
370 375 380 

Pro Ser Ser Met Pro Leu lie Ser Arg Glu Ser Leu Glu Gly Pro Leu 
385 390 395 " 400 

Pro Gin Gly Thr Lys Val Leu Xaa Val Arg Ser His Xaa Pro Asp Ser 
405 410 415 

Ser Ser Arg Thr 
420 



<210> 59 
<211> 32 
<212> ADN 

<213> Homo sapiens 
<400> 59 

taaactacaa atggttcttc aaatggagcc ca 32 

<210> 60 
<211> 32 
<212> ADN 

<213> Homo sapiens 
<400> 60 

gatgcagtcc aagatgcagt ccatgactaa ga 32 

<210> 61 
<211> 1740 
<212> ADN 

<213> Homo sapiens 
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34 



<400> 61 

aggttggctg acaaccgctc ttaactgctt 
gcagttgaga tttccttggg aggggtgcct 
gcaggccagt ccaggggtcc gcggtagatc 
tgaagaacca tttgtagttt tacagcttcg 
ttaaagatac aaggattgaa atgtacggcc 
tgcaagtggg gtttccttta gaaaaactcc 
gccacattct ccatagaagc tctcggtaag 
ggggtgcagt gagagtgaaa gggggtaaga 
gggccaagag gatctacgat; tctagttact 
gcagatcctc tagaggttca caggaatagc 
ttggcagtat ccagggtttg gctcgagtgt 
aactgcggtt agggtagata aaatgactgg 
tggggaatta aaggggaagg gacttgacta 
ttccctcctc tcagggacag gttccctgta 
aggaggtgat gtctgcaact aagttggccg 
ggaagggctg tccatacagc atctcatatg 
ggattcttag taaggctata ggcaacagag 
gcttttttag atgtcgtttg agtgtttcat 
gcctccaggc acagtgtaag tgatattgta 
ctgcagcctt gaaattgggg ccattgtcac 
gaattatttc atgaattagt acttttatta 
aggcctccac ccaaccagtg aaagtaccca 
gggcatgtgg gtaaaatcta gttgctagtc 
tcctgaagga gcttggcaat aaggcagggg 
gactatctgc ttgacagttt tgaaaaggcc 
atgggtgctg tcaatgccta agtgaaaggt 
gttagctgca ggcaaaagta ttttttcttt 
atgtcctcgt gagtttcccc attccatttc 
gaggggatta ccccatacta ggggtccttc 



catgctgaat tggggcatag taggggtcgt 60 
tcaatgtcat caacattgga gcatgggcta 120 
ttagtcatgg actgcatctg gggctccatt 180 
attctggaag agacaaacgt aacaaggagg 240 
tgaagtgcag gggcatatga gtgtgggcgg 300 
gatacaatag ggcatcaata tttctaggaa 360 
gggagctact ggtagtacag cagcatacag 420 
gaacagtaaa aagaaaaata tgacaaggga 480 
ttcctcacgg ttgtcgcctg aagagcaggc 540 
tagcattgtc tgctggattr tcgggttcct 600 
gacttatcca agactccact ccagccactt 660 
gtagggtcct tcccaggatg tgtgtaggga 720 
ataccatgtc accagggtgg aataattcct 780 
atgttttaag aactcgttga tatttggcta 840 
tctctcagtc aagcacaagg tcattggtta 900 
gactaagtcc tgctttttgg ggacagtttc 960 
caggccatgc aaggtgggtt tcttgggtta 1020 
tcattttctc aacttttcct gaggatcgtg 1080 
tacctaacgc ctgggatacr ccctgcgtta 1140 
tctgtaaacc tcagggaagt ccgaatctgg 1200 
cctcttgggc cttttctgtc ctacaaggga 1260 
gattagtaga tactgaaatc tctgagattt 1320 
ttctcctggg taatggcctg ttctttgttc 1380 
attatttctt tggcacactt cacaggccct 1440 
tggtccagta aataatgatt tggccatctg 1500 
ctggtgaagg gttttaagta atttccattg 1560 
ggtggctggc catcctgagg agaggaaact 1620 
ttctgctgag tactggagct tggtttccca 1680 
tgtaagcatt tctaatggag agtcctgcct 1740 



<210> 62 

<211> 7140 

<212> ADN 

<213> Homo sapiens 

<400> 62 

ttggtcttaa gaacacaaat gatatggctc 
tctcacgctg atttagataa aacgactgtc 
ccctgtgacc tgcacgtata catccagatg 
gtgaaaatgg cctgttcctg ccttaactga 
cccatcttaa ctgagcgatt aaccttgtga 
actgagcacc ttgtgacccc cgcccctgcc 
ttccactacc cacccaaatc ctataaaatg 
tttttcggac tcagcccgcc tgcacccagg 
gcctgtttgg tggactctct tcacacggac 
taggaggact ccttcaggag accagtcccc 
acctacaacc ttgggtcctc agaccaacca 
aggtaagcag tcttttcact ctcttctcca 
ctcactaccc ttcaatctcc ctgtccttcc 
acaaaggaga cacattttat ccatggaccc 
agacagtctt cccttggtgt ttaatcactg 
ctccattggt gtctgatcac ggtggggaca 
ggtggtacgt caactgcaaa agcaggggac 
tctgtgtctc tacctttctc tttaaactta 
ccattccccc ttcttctccc ttagcctgtg 



caatgactgg aggaacacca gggtccttgg 60 

aggcctctga gcccaagcta agccatcctc 120 

gcctgaagta accaaagaat cacaaaagca 180 

tgacattcca ccattgtgat ttgttcctgc 240 

aattccttct cctggctcaa aacctccccc 300 

cctaagagaa aacccccttt gattataatt 360 

gccccacccc tatctccctt cgctgactcc 420 

tgaaataaac agccttgttg ctcacacaaa 480 

gctcatgaca tttggtgcca aaacctggga 540 

tgtccttgcc ctcactctgt gaggacatcc 600 

gcccaaggaa cagctcacca atttcaaatc 660 

gcctctcttg ctacccttca aactccctct 720 

aattccagtt ctttttcatc tctagtagag 780 

aaaactccag caccagtcac ggacttggga 840 

cggggacgcc tgcctgatta ttcacccaca 900 

cctgccttgg tcactcaccc acattccctt 960 

gcctgctttg gctgctcacc cacccccttc 1020 

cctccttcac tatgggcaaa cttctgccct 1080 

ttcttaaaaa cctaaaacct cttcaactca 1140 
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cacctgacct aaaacctaaa tgccttattt 
aacttgataa tagctttaaa tggccagaat 
atctagataa tttttgtgga aaaatggaaa 
tcttttacac attggtccct ccctagtctc 
cttctttctc tcctgtctgt tccttcagtc 
tcctttgcta cagacccatc tgaactctcc 
gagccaggtc ccaattcttc ctcagcctct 
tcctctcctc acactcagtc cggcttacag 
gcccaacaat ttcctcttaa agaggtggct 
cctttttctt tatctgacct ctcccaaatc 
ataaaaaccc agccagttca tggcccatct 
agaccctgaa gggtcagaag gccgtcttat 
tcccaacatt aaataaagct ccaaaaatta 
ttaattaacc tcacttcaag gtgtacaaga 
tttgagttgc aattccttgc ctcaactctg 
aagaacttca aaacacctga actgcagcag 
ggatcttgct tcaagtgccg gaaatctgac 
attcctccta agccacgtcc catttgtgca 
cacccggcag ccaatcccag agcccctgga 
ttcccagatc ttctcggctt agcagctgaa 
ccctggacca tcacggatac tgagcttcag 
ccctgtttaa tcgatacagg ggctacccac 
tccctttccc ccataactgt tgtgggtatt 
cccccactct ggtgccaact tggacaacat 
acctgcccag ttcccttatt aggccgagac 
attcctgggc tacagccaca tctccttgcc 
tatcttcctc tcatatcccc ccaccttaac 
ctggcaaccg atcacacgcc cattactatc 
caatgccagt atcccatacc acaacaggct 
ctgctacagc acgggcttct aaaacctata 
gtctaaaaac cagataagtc ttacaggtta 
gttttgccta tccaccctgt agcacccaac 
cccacaactc actattccgt tcttgatctt 
ccctcatccc agcctctctt tgcttttacc 
cagcttacct gggctgtact gccgcaaggc 
gctctttctc atgatttact ttctttccac 
gatgaccttc tactttgtag cccctccttt 
cttcaacatt tgttctccaa aggatatcgg 
ccatctgtta catacctcgg cataattctt 
tgcgtctcca actgatctct caaatcccaa 
tcctaggcat ggttggatac ttttgccttt 
cattatataa actcacaaaa ggaaacctag 
actcctcttt ccattccttg aagacagctt 
tctcatccca acccttttca ttacacacag 
ttacacaagg accgggacca tgccctgtag 
ttttaggctc gccatcatgt ctccatgcgg 
ccctcaaaat cacaaactat gctcaactca 
tattttcttt ctcacacctg acgcatatac 
cactctttgt tgagtctccc acaattacca 
cccacattat tctggatacc acacctgacc 
cattcacccc atttccccat atttccttct 
ttactgacgg cagttccacc aggcctgatc 
tagaatcttc cacatccatc attgaggcta 
aagccgaact gattgcctta actcgggcct 
tttatactga ctctaaatat gccttccata 
aaagaggttt cctcactacg caagggtcct 
ttctcaaggc tgctttactt ccaaaggaag 
aggcgtcaga tcccattact ctaggaaatg 



35 

tcttctgcaa cactgcgtgg ctgcagtaca 1200 
atggcacttt caatttctcc atcctacaag 1260 
aatggtctga gatgcctgac gtccaggcat 1320 
tgctcccaat gcgactcatc ccaaatctti 1380 
tccaccccaa gctctgagtc ctttgaatcc 1440 
cctcctcccc aggctgctcc tcaccaggcc 1500 
gctcccccac cctataatcc ttttatcacc 1560 
tttcgttctg tgactagccc tcccccatct 1620 
ggagctaaag gcatagtcaa ggttaatgct 1680 
agttagcgtt tacgctcttt ttcatcaaat 1740 
ggcaacaacc cttacaggct ttacagccct 1800 
tctcaatatg cattttatta cccaatccgc 1860 
aattctggcc ctcaaacccc acaacaggac 1920 
atagagtaga ggcagccaag tagcaacgta 1980 
agagaaaccc cagccacatc tccagcaaac 2040 
ccaggcgttc ctccaggacc acctccccca 2100 
cattgggcca aggaatgcct gcagcccagg 2160 
ggaccccact ggaaatcgga ctgtccaact 2220 
actctggccc aaggctctct gactgactcc 2280 
gactgacact gcccgatcac ttcagaagtc 2340 
gtaactctca cagtggaggc taagtccatc 2400 
tccacatcac cttcttttca agggcctgtt 2460 
gacggccaag cttcaaaacc ccttaaaact 2520 
tcttttatgc actctttttc agttatcctc 2580 
attttaacca aattatctgc ttccccgact 2640 
gcccttcttc ccaacccaaa gcctccttca 2700 
ccacaagtat gggacacctc tactccctcc 2760 
ccattaaaac ctaatcaccc ttaccctgct 2820 
ttaaagggat tgaagcctgt tatcacttgc 2880 
aactctccat acaattcccc cattttacct 2940 
gttcagaatc tgcaccttat caaccaaatt 3000 
tcgtacactc ttttgtcctc aatgccttcc 3060 
aaagatgctt ttttcactat tcccctgcac 3120 
tggactgacc ctgacaccca tcagtcccag 3180 
ttcagggaca gccctcatta cttcagccaa 3240 
ctctctgctt ctcaccttat tcaatatatt 3300 
aaatcttctc aacaagacac cctcctgctc 3360 
gtatccccct ccaaagctca aatttcttct 3420 
catgaaaaca catgtgctct ccctgccaat 3480 
cctcttctac aaaacaacaa ctcctttccc 3540 
ggatacctgg ttttgccatc ctaacaaaat 3600 
ctgaccccat agattctaaa tcctttcccc 3660 
tagagactgc tcccacacta gctctccctg 3720 
ccgaagtgca gggctgtgca gtcggaattc 3780 
cctttttgtc caaacaactt gaccttactg 3840 
tagcttccgc tgccctaata cttttagagg 3900 
ctctctacag ctctcacaac ttccaaaatc 3960 
tttctgctcc ccggctcctt cagctgtatt 4020 
ttcttcctgg cccagacttc aatctggcct 4080 
ctgatgattg tatgtctctg atctacctga 4140 
tttctgttcc tcatgttgat cacatttggt 4200 
gccactcacc agcaaaggca ggctatgcta 4260 
ctgctctgcc cccctccact acctctcagc 4320 
tcactcttgc aaagggacta cacgtcaata 4380 
tcttgcacca ccatgctgtt atatgggctg 4440 
ccatcattaa tgcctcttta ataaaaactc 4500 
ctggagtcac acactgcaag ggccaccaaa 4560 
cttatgctga taaggtagct aaagaagcac 4620 



WO 99/67395 



PCT/FR99/01513 



ctagcgttcc aacttctgtc cctcatggcc 
cctactcccc cattgaaact tccgcctatc 
tagaccaagg aaaatatctc cttccagcct 
ataacctctt ccatgtaggt tacaagccac 
tccatcgtgg aaacatatcc tcaaggaaat 
tacccctcag ggattgttca ggccccctcc 
ccctgcccag gactggcaaa ttgactttac 
cctcttggtc tgggtagaca ctgtcactgg 
gaaggccact gcagtcattt cttcccttct 
cacctctata cagtccaata acggagcagc 
tcaggctctt ggtattcagt ggaaccttcg 
ggtagaatgg actaatggtc ttttaaaaac 
aaaggaggat agagcccaaa aactcgcaac 
gcactctcta attggatgtc ttaggtcctc 
ctccttctct tattcggacc ttgtgtcttc 
atccaggcca tcaccaatcg ttctatacaa 
cgccccttac cacaaaatct tccttcagct 
cccataatcc ctctcgaagc agccctgaga 
ccaaaatttt tgctgcccca acacttcaac 
aagaagacag caatgtcagg cctctgagcc 
tatacatcca gatggcctga agtaactgaa 
cctgccttaa ccgatgacat tccaccactg 
aattaacctt gggaaattcc ttctcctggc 
cccctgcccc tccactaccc acccaaatcc 
ctgactcctt ttttggactc agcccgcctg 
cacacaaagc ctgtttggtg gactctcttc 
cacatggagt ggttttaagg agcagagagt 
cctgtacaga cacagaggga gggggctcca 
gaaaagtggt tgattatact gggaggctgg 
aggggattgg gttgaccagg tgtatcattc 
cctcagccct ttaatatgca aatgtgggtt 
ctggaggggg ccatgacact tggtacatgt 
gtggccatgt tgggtggacc tagtttttaa 
gcctggctct ttaagctgtc ttttctgtta 
tgcttcttat tacaagaaaa tttccaaaaa 
tttcttaata acttatgtat taccataatt 
ccactgcaat taacatgctg gctttactgc 
tcatattgca actgcctgac ctctgccacc 
gcccatttcg attgtaacat ctgccactta 
aattcattca acatccattc caacaccacc 
gaattactga gtcacatgat cttcactgca 
acagtgaaca tagacagaag tccctggggc 
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agtttttctc cttcccatca gtcattccca 4680 
aatctcttct cacacaaggc aaatggttct 4740 
cacaggccca ttctattctg tcatcatttc 4800 
tagtccacct cttagaacct ctcatttcct 4860 
cacttctcag tgttccatct gctattctac 4920 
cctccctaca catcaagctc ggggatttgc 4980 
tcacatgccc tgagtcagga aactaaaata 5040 
atgggtagag gcctttccca cagggtctga 5100 
gtcagacata attccttggg ttggccttcc 5160 
ctttattagt caaatcacct gagcagtttt 5220 
taccccttac tgtcctcaat cttcaggaaa 5280 
acaccccacc aaactcagcc tccaacttaa 5340 
caagctagta attatgctga acccccttgg 5400 
ccaaatctta gtcctttaat atctgttttt 54 60 
cgtttagttt ttcaattcat acaaaaccgc 5520 
taaatgctcc ttctaacaac cccacaatat 5580 
taatctctcc cactctaggt tcccatgccg 5640 
aacatagccc attatctctc cataccaccc 5700 
actattttac attatttttc ttattaatat 5760 
caagccatca tatcccctgt gacctgcaca 5820 
gaatcacaaa agaagtgaaa atggcctgtt 5880 
tgatttgttc ctgccccacc ttaactgagc 5940 
tcaaaacctc ccccactgag caccttgtga 6000 
tataaaatgg ccccacccca tctcccttag 6060 
cacccaggtg aaataaacag ccttgttgct 6120 
acagggacgg gggtgacaac aacacggaca 6180 
ttaatacgca aaaaagaagg aagaggctcc 6240 
agccgagaga aggaaacccc atgtgcagtg 6300 
aggaggcggt gtctgatttg cacagggccc 6360 
atgtaccccg caaaaaacct ggccctccca 6420 
gccatgatgt tctgaaaaca catgaattat 6480 
gctgacaaga agagggtggg aatcgccatg 654 0 
tagcctgcat ttgcatatca aagtttgctg 6600 
gaaaaggaat ggtttggaat gggtgagggt 6660 
cctttactct ttctagctgc caaaaaacta 6720 
aggcagcacc aaagatccct gcaggtcaga 6780 
tgattatggt agctgcatcc acctagcctc 6840 
ccacgagcca cttatcccca cttataatca 6900 
ttcccgacgt tgtggtatat cctatagatg 6960 
tctcttgcct tcctatactc tctggagagt 7020 
gtcatttgtg gctatgtgac atagttctgg 7080 
gggcttcctt tctgggatga gggcaaaacg 714 0 



<210> 63 
<211> 44100 
<212> ADN 

<213> Homo sapiens 



<400> 63 

tgcctttatt 

agcgaatgaa 

ttggcccgtg 

ccgccgctcg 

ctgagctccc 

gagaatcgac 

cccccgagcg 

tacaggctta 



tccgtaggct 
accaaaatca 
tgtcgcatac 
acgccatctt 
ttttatccaa 
agcgtcggcc 
gctcggcgga 
cggcaggatg 



ggtcatatgg 
ctttaccttc 
cgccctctgg 
gcctactttg 
taagagagcg 
atcgtttcct 
gaggcgcggt 
cgcagcgggg 



cgctagcact 
acagcacgag 
acgtggtgat 
atcctcgcag 
ggatgagtta 
gcgtgcgaag 
gggtgacaga 
agagggggcg 



cacataaagc 
gccgtcgtcc 
caaataaact 
ggaggacaac 
aggagtgcca 
atttgatgaa 
agctttcttg 
gggccgcagg 



taccgaggag 60 
ctctcgatat 120 
ccctagctcc 180 
atccgcccta 240 
ggattggctg 300 
cgaggtgccg 360 
tcccacccac 420 
gggcggggcc 4 80 
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gatcgatctc 
tagggtgggc 
gtgctggggg 
tccacctgcc 
gagccacctg 
gacaccggct 
gggcccttct 
cccaggtctt 
tttataaata 
ttttaaaagg 
ccgcgagagc 
ccgcgtccca 
ggaacacagc 
gatcagtcgc 
gatacagcgt 
gtacttatgg 
acccaccagt 
tttccacttg 
gagttcagca 
ttttggtttt 
gtagaagttg 
tgcacttaat 
gttaccttac 
gagccttcgg 
ctttagccct 
ttactttcta 
tttattcctc 
gcatggaaaa 
aatgttgaca 
atgaggtcct 
tgagtgtttt 
aatttgccat 
ttaggcatta 
ttagaaaaca 
aggccataga 
ctttatttgg 
ttggaacaat 
gttctgatca 
gcatctctaa 
actgtcctag 
tgtactttta 
tttgccctct 
ctataaccaa 
ttttcttcct 
tagctttcca 
atgtgacaca 
tactcaagtc 
accttggcac 
attttaagat 
cctatctgtg 
tcacctctgg 
tgtgattgca 
ccattcggat 
tttggacctg 
aatactgata 
cctggaaaag 
tctgtggttc 
tttgctcaat 



ctccggctcc 
gaacccagag 
aggcggggcg 
gcggcgtctc 
atcttcagcc 
gccacccggg 
gggtagtctc 
ttcacttggt 
ttccttattc 
tgttttcctt 
gggacgcaga 
tgagcgggaa 
tgtagtgtgt 
ccttctggac 
ccatattttc 
gggcaaaagg 
ggctaatcta 
agttacttcc 
gaatcctcct 
tgatgggctt 
gttcagtgct 
agtaggaatg 
attcatcact 
gaagtactta 
ggaacaaatt 
attatcaatg 
gatgaattat 
ttattaacaa 
gtttggatca 
gtatacacac 
attttgttaa 
aatttattta 
gaagtgataa 
tcattttatt 
taattatgaa 
ggtgaagcat 
ggttttctgg 
accctcagac 
ttttaaaaaa 
aatcatagaa 
catgtaagga 
tgtctatagc 
tctccttccc 
tccatacaaa 
attctctgtt 
tcacatttga 
attatttcag 
tgttgacatt 
gtttaacagc 
acaaccaaaa 
ttgagaacca 
gcagggggag 
atggccacac 
attattccta 
cctcagtttg 
acgctccttt 
aagtgaagta 
ataactgagc 



gacgtcctcg 
cgacgctccg 
gcagtgactg 
gtggcccagc 
tggggtcgga 
cgccgccgaa 
tggatcccac 
gaaactgaac 
caggctggaa 
gccagccatt 
gttgttggcg 
aggttaatac 
taggaacaca 
gttgtggtta 
ataattaaaa 
acggcgtatt 
tgcaatgaat 
ccatacctag 
atcatcgtcg 
tatggctaga 
ctgtcagctt 
ctttcttaca 
gtttaagaat 
taagaattaa 
gctgtttctg 
taataagttt 
ataaatttat 
gaaaataagt 
aatcttccag 
gtacagtttt 
aaggtcatca 
attgtttact 
actatatttt 
tctggttgtc 
agcagaaaga 
tgagtgcata 
cctatgtcag 
ctattaaatc 
tttattcagg 
ttttaatgac 
aactggcatt 
tcactctgca 
acttctgttc 
ttccatgtct 
gcccacattt 
tatactctgt 
gactgactac 
ttgagctgga 
acccttggcc 
aggtcttcag 
ccgcttcaac 
aggattcata 
aattttcatt 
aggcattctg 
ggtcaaagaa 
ctagctgtct 
ttttgacata 
acatattgtg 



gcctgccggg 
ggacgatgtg 
tggccttcac 
tgcatctgct 
cgaggccgaa 
gcgcgcagag 
aagtccagtg 
ctagaaacgt 
aagctcctga 
tccagttaac 
gagcccctgt 
aatgatggtt 
taacgtagtt 
ggatgtttca 
atagaggcac 
tgaaatcctc 
agagtttgca 
gggaagatat 
ttattatttt 
gacaaatcag 
cgatgggatt 
gtaactctaa 
ttagtggtct 
ttcatgcata 
ttcagcccat 
attactttat 
agaatttatg 
tacccataat 
ttttgtttct 
gtgtcctggt 
ttttaagttg 
atgattgacc 
aatcagacgt 
taggatagat 
ttcacaagtt 
atacagatca 
acttaccttg 
agacctaaaa 
ctacttggat 
gatagagacc 
cctaggccag 
tcacccaacc 
tcttactcat 
ttaaaaagga 
gtctcccttt 
actgtgtttc 
ccagtagatg 
taattttttg 
tctatccagt 
acattgtcag 
taagttatct 
tacacagtga 
tcccttgtgt 
atgtatggtt 
ggtcaattaa 
ctttcttctc 
aaaattaact 
gctttatgga 



t cccgggtcc 
gggcagcgat 
caacgctcgc 
gcaggtaacc 
gcctctcagg 
atcagggt cc 
cagccctggg 
cctaatattc 
gaagtggtt t 
ctgcgctgct 
cggttcccgg 
ctgccctgcg 
aagatcacr t 
cagttctaac 
atggtctcac 
ataaatcctg 
ataattt caa 
ttttggtcca 
ttaccactaa 
tcactgtcac 
tttcaacatg 
tttgatccta 
tgatctttgt 
tctttttgaa 
attagcagaa 
agattccata 
ttttatagaa 
cccagaacrt 
aatctttatt 
gtttttattt 
ttaattagta 
atttagattg 
tgaaaataac 
tcccagaatt 
gggagttaat 
tgcagtaatg 
aagcttttaa 
tcttagggaa 
gcacaaaaga 
ttaagcatct 
taccattgcc 
taccgttctc 
gccattcttc 
ataatcctac 
caatacttct 
aagtattgta 
ctttaagtca 
ttttgggggc 
agacgcctgt 
atgtctactg 
tctctgtact 
atgcaaacga 
tagcaagaga 
ttacctgcag 
ttgattgatt 
tttacctgaa 
tagaacattg 
gctggttact 



tttgcggcgc 
cgcctggcgg 
gaccgct tec 
tgccggcccc 
gaegeggegg 
ctcgacggca 
ctegtet tat 
taccactgtt 
gtttttatta 
gccgtccggg 
ggactaagca 
tcgctgacgc 
gaagctctgc 
cactggtgga 
gagtttgagt 
gatgcatggt 
gcatcccttc 
ctgaaaacat 
gtagacaatc 
caagttccag 
ttttcaaacc 
agatgtagtt 
tttaaatttt 
atgtaaatgt 
taggtcaact 
aatctataca 
aatttggaaa 
agaggtgact 
tttaacataa 
aatgttatta 
ttctagcaca 
tacttaattt 
acatctttgt 
cttgggttag 
acttgaatta 
ggaagaaggg 
gaatacagat 
taggctttag 
gttgagacct 
aggtegtt tc 
atgcagctaa 
actgtttctt 
cctcagtcat 
ctcctccaca 
ctgttgtgtt 
ttctcttgtt 
ggatttctca 
tctcctgtac 
actgcctccc 
aaggacaaaa 
cagaacttga 
acctaaatca 
taccctaggc 
atttcctggt 
tgatttgact 
tagecaggge 
gtctgeagag 
actttttgac 
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caaataaata attagaagta tttttcctcc 
gagctggtag agtttccttt tttgatattt 
gtttcttcat atgaagtaga atttatctgg 
atagaaagca tctggggctt gatcaccttc 
gatatggtaa cttaagactt ttgattccaa 
tttgtcagcc agaacagttg gactgttctg 
gtgatacatg atgatggctt tcttaaatat 
acgttatatt gtcccagaag tggctccaac 
cataagctgg ctatggtggc tcacgcctgt 
cagatcacct gaggtcagga gttcgagacc 
tactaaaaat acaaaaatta gccgggcatt 
gaggctgagg caggagaatt gcttgaatct 
gtgccactgc cctccagcct gggtgacaga 
aaaagcaaga aacataaaga ctgggcatgt 
gagactgagg tgggaagatc acttgagccc 
ttgccactgt actcgagcct gggcaacaca 
gcatgtaaat gaatgaattt gatatttaat 
atgtagatct tgccatgttg cccaggctgg 
tgtctcagtc tcccaaagta taaagattac 
ttttaactta atgaatttat tttgatataa 
taataagtct ttttgtgtgt gtgacgggtt 
ggcactatca tggctcactg tagcctcaac 
gcttcctgag tagatgggac cacaggcgta 
tattattgat acatattaat aaaattattt 
atggtggctc atgcctgtaa tcccgacagt 
gaccaggagc ttaagaccag cctaagcaac 
aaatggctag gtgtggtggt gtatgcctat 
aggattgcta gagcccagga gtttcaagtt 
cagcctgggc aacagagcaa aatcctgtct 
gatgcaatat aagtagtgga aaaggatatt 
aaaaacttgc acatagagaa aaggattaac 
tcttgtttgt ggagagaata tcagtagttc 
cgaggtctct ataatgagtt tgtaattgtt 
gccacaaact tacatgtttt aatgtaattg 
gcttttttaa aacctatatt cccatagtta 
ataatataac gtttctggaa gggtacagaa 
gacatggctt cacattttac ccttttgtac 
ttcttccaat aaataagtaa ataaatatgg 
aattctaaaa ttatattgct acatttttaa 
tatgttaaaa tagtaaattt atatcttatt 
acagtctcaa gtgttcacta tcatagaaaa 
ttttttcttt gaatcgttaa ttgggaataa 
ctatttaagt ttattgactg actgctgcca 
ataatgctgc cataagaata taagggtatt 
ttggaaatga ttatagattt ttaaatgcta 
tagaactctt tttggacatg tgaattgtaa 
aatgtatacg aaaacctttt ttcctctcat 
gtggtctgga gtcaccagcc tgcattcttg 
gggggacagg taagcacatg tgatggcaat 
atagaaataa aattaaaagt ttagattttt 
gtatgctatt atgtaactag tctaggatat 
ttatcttgta gtttaccata ctccctactt 
cacatcccct aattttggtt tcatgaaatt 
tactattatt aaactttatt tctgacatat 
aaaataaaaa attcagctgg gtgcggtggc 
ccaaggtggg cggataattt gaggtcagga 
accccccctc tctactaaaa attcaaaaat 
cccagctact caggaggctg aggcaggaga 
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tcaataaggt tcatttttcc ttttttcagu 4020 
cagggcatct ttcatatttc catctcttaa 40S0 
attatgtatt gctgactctg atgaaaaccc 4140 
attcttgtaa tagctcacac ggttacagct 42C0 
atctaggcaa aatacactca gttgaaagaa 4260 
tgaaaattgt gagaaaaatt acacaactaa 4320 
aaaattgtaa taacatggct aatttccagt 4380 
attgtttgaa atttgtctca tttaaagaaa 4440 
aatcccagca ctttgggagg ctgaggcagg 4500 
agcctggcca acatggtaaa accccatct: 4560 
tggtgggggc ctgtaatccc agctacttgg 4620 
gggaggrgga ggttgcagtg agccgagatr 4 680 
gtgagtctcc gtctcaagaa aaaaaaaaaa 4740 
tggctcatgc ctgtaatccc agcactttga 4800 
aggaggttaa ggctgcagtg agccgtgatr 4860 
gtgagatcct gtctcaggaa aaaaaaaat: 4920 
attttaaatt atgaaaactg ttctgtagag 49S0 
ctttgaactt ctgggctcaa acaatcctcc 5040 
acatgtgagc cactgcacct ggcctaatat 5100 
ataaattaat aacactgaag cttcctgata 5160 
ctcactctgt tgcccagact ggagtgtaaz 5220 
ctccctgact caagtgatcc tcccacctcg 5280 
tgccaccaca cctggctgat ttttaaaat" 5340 
ttattttaaa aatgatatat gtggctgggc 5400 
ttgggaggcc gaggtgggag gatcacttga 54 60 
atagtgagat cccatctcta tagaaaaaaa 5520 
attcccagct actcaggaga ctgaggtgag 5580 
acagtgacct atgattgtgc cagtgcactc 5640 
caaaaaaaaa aaaagttcga aaatgcttar 5700 
aaattgtgcc tatatgaaca caactatatg 5760 
aagaaataga ccaaattgtt cacatggttg 5820 
atttgtttcc ttccaagttt atatgttttc 5880 
taatcataga aaaccctttt ttggtccttg 5940 
cttttttaat gagaataaat gttatatttt 6000 
tatgagccct tacaattatt aagaggctgc 6060 
gaaacagcag taattacctc tgagaacaga 6120 
gttttgtgct tttgccacat gcatttatta 6180 
attgtatact ccatctggtt ggtgtttcat 6240 
agatgatatg tgtttctact tattaacgta 6300 
taataatttc cctattgata gacatttaag 6360 
tactgcacag atagcttttg ctatagtttc 6420 
atgctcaaat agttatatgt ggctcaactg 6480 
ttttgaattc tgaaggggtt gattaaattt 6540 
ggcttcatta gcatccacca gcattgggtg 6600 
caacaaatgt agataacaga gaactatcta 6660 
taatagttta ttttcatgtg aatccagaaa 6720 
ttcttatatg aatagaatca agctatagaa 6780 
agctgggtgg aaggcaggca ttttagtgat 6840 
aactttcttc taatatcaca taatatagca 6900 
tgttaaagga ggtgagatgt cacctaattt 6960 
tgaagctgac tatactctgt ttttaggtca 7020 
gcttcttatt ctactattta actcattttc 7080 
atttttcctt ctgaattact aggttctact 7140 
tttataacct tccatggtct cacttgatta 7200 
tcacacctat aatcccagca ctttgggagg 7260 
gttggagacc agcctgccca acgtggtgaa 7320 
tagctgggca tggtggcagg tgcctgtaat 7380 
attgcttgaa cctgggaggt ggaggttgca 7440 
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gtgagctgag attgcactgc tgcacttcag 
aaaaaaataa aaaataaaaa attctacaac 
cccttatgag tttaatatgt ttagattata 
ttttgttttc ttatgtttat caagttattc 
tgtgaggctg ggctcaatgg cttatgcctg 
gaggaccact tgaggccacg agttcaagat 
atctctataa aaaaattaaa aaaattagct 
ctactcagca gactgaggta ggaggaatgc 
tatgcactcc agcccgggca atagcaagac 
taatacatat tcattataac tattttacca 
cccagtccca tcctcagaat ggggatctca 
attcatattt tctgcaatta ttaccccaca 
aaacaatgtg catttaacat gtctctctct 
tcctctgttg cagccctgcc agtaagacac 
aaagtggact ggctaggcca ggagtcctta 
tttctcagaa tcagatatat atgtggactg 
ctatacgttt aaaacttata tagatggggc 
acaatacacg agagtgccat gtctttttaa 
tgcatgtttt ttgatgagaa taggctactc 
cttgcatact ctaaattgtt gctagaatct 
atcattaact ttggtgcttt gttctacaat 
gcttagcagg ttacagttct gccctctgag 
cttcctgatt ttcaagtctt aattagtact 
tttgctttga agtgacttta cctgattttt 
gaaactgagt ctctagcttc ttggtgggca 
cttttcagta agggagatat tgaagagaaa 
agggaaatcc tgctccagtc cacaaaagca 
aacatgcaga ggctttggat tttactcctt 
aggaagtaag atggtgactc cagcttatag 
aataggaggg tattattagt tttacttaac 
atttgtctcc agtgtctatt tcagtgtatt 
gcaaaacttc tagaaataat gagaatattt 
atagtcattt cttcttatat tttttactta 
tttgaaaaac atgtcatgct gagatgtatt 
gtttttccta aaatgctgag tatatcaagt 
cacatgaaag actacacata tagccaggtg 
caggaggctg aggcaggagg attgcttgag 
attgtaccac tctactccag aatgggtgac 
agaaagatta catagactac atatacaccc 
acctaaaatg gtaagaagat aacttcttat 
taaagtagtt ttaaattttt aattttttct 
tatcttgtca acaagttgag gtggaacccc 
agaaaaccaa ataagaacta tctcatttaa 
tagctttctc taagctttat tatatattct 
gggccaggca cagtagctca tgcctatagt 
attgcttgag tccaggagtt caagaccagg 
taaaaataca aaaattagcc aggcatggta 
ggctgaggca ggagaatcgc ttgagcccgt 
gccattgtac tccagtctgg aaaacagagt 
attgatagag atctaatgta caacctgaca 
catgttaaat gagtagattt taactactct 
gagatgatgt atatgttaat ttacttcact 
tcataacacc atgtcgtgta tattaaatat 
attgagattt tttttaacta gatatggagt 
gtctgttggt tctaggagct gcatgctgtt 
cgaatagttt ttccaaaagc catttttcct 
atccaaattg gtaggtgcta ttgtaatatt 
tccaaagtag aaatgaatgt gcactaatga 
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ctgggtgaca agagcgaaac aatgtcttga 7500 
acagggttat tatttttcca tttttgtttt 7560 
aacctgaaag ctt gaatacc tatgtctatc 7620 
ctttaaacat tttctaaact gtaagaataa 7680 
taatcccagt gctttgggag gccaaggtgg 7740 
tagcctggct aggcaacata gcaagaccct 7800 
gggcatggta gcaaatgctt gtagtcccag 7860 
ttgagaccag gaatttgagt gacctatgat 7920 
cctatctctt aaaagaagaa gatgtagtaa 7980 
ttgaaagtaa aaaatgagtt tttacctttt 8040 
gtagaccttc aggattggaa gaatgagatc 8100 
aaatatttca gatacctttc catgtattac 8160 
rtctctctct ctctgtgtgc gtcttcatga 8220 
tatctcctga agaatcacig ataggaacag 8280 
gcttcttagg gggcaggagc tgctttgtgc 8340 
aaacatttaa aaacagaata gccaagggtg 8400 
tacattgctc tctattacta atttcccatg 8460 
cttgttttga gcacagacta atcttgttta 8520 
atgagaaatc tgtaaaccca acactagtcc 8580 
taaaatttta gcaccagacg gaccttagaa 8640 
acaaggagat ggaatattct acccaggatt 8700 
tacccagcac ttccctgtgg gcaacatcaa 8760 
ctgaagaatc ctacttgttt ttaactccca 8820 
ttagatccct tattgcagca atgccactaa 8880 
ggagctgctt tgtgcttgct cagaatcatc 8940 
tctactgagg agtctggggg tgaggcactc 9000 
gagaggaagg gttggttacc tagagtattt 9060 
taatccttgg aaatgcctat ggaaggggaa 9120 
acatactagt gttacatata tttaaactat 9180 
tttcaactgt gaaggattat acttctcaat 9240 
tttcactttt cttgaagcag catgtctgtt 9300 
atatattaga tcaagccata acttgatgat 9360 
catttttaca ttttaatgat tactttcatt 9420 
tttcttcatt ctgtaattag ttatgaaaca 9480 
cttggctaag aataagtaat aaatatttgc 9540 
cagtggcttg cacctgtttt cccagctacc 9600 
cccagggttt ccaggctgca gtgaactatg 9660 
agagccaggc cccatctctc aaaacagaaa 9720 
ccatccaaaa catacacaca catctactta 9780 
tttctaatat atgacacaga aaagtttttt 9840 
aggtatttct caagccatgt tcccatgtgg 9900 
tctcagcaga tgattgggag atactggtaa 9960 
ggttaaatta cttcacaata tcaatgtctt 10020 
gagttggttt tgaattataa gaatgaattg 10080 
cccagcactt tgggaggcca aggcaggtgg 10140 
ctgggcaaca tggtgaaacc ccgtatctac 10200 
gtgcatgcca ttagtcccag tcacttggga 10260 
aaagtcaagg ctgcagtgag tcaggatctt 10320 
gagaccttgt ctcaaataaa aaaagaatga 10380 
actataggta ataaaattgt attggggatt 10440 
taccacaaaa acacaaaagt gggtaactgt 10500 
atagtaacca ttatactatc tatatgtagc 10560 
gcacattaaa atttgttttt taaaaaaaga 10620 
ggacaaaatg taaagtgaat tgatcttttc 10680 
tcccttgaac aacatcttct agatcaaatt 10740 
gtttgggttg atcaacaaac gtacatattt 10800 
tgctgtcata ttctacacta tagcattgag 10860 
gctttatttt ctacacagtt gcactaatac 10920 
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cagctgcctc 
gccgagccaa 
atggaagaga 
ctgtgggaat 
tagcaagttt 
agacatcttg 
ctctagacaa 
caacctctgt 
ttgatgtaga 
agcaacagca 
cagagccact 
gtgtgctaca 
aaaatgtaga 
agaaatrtta 
aattgaaaat 
ctttgcagta 
ataggiacaa 
atagctagtg 
tggagtgccc 
aagcaacttg 
aaccttcctg 
gccggtgtct 
tccagcccct 
tccatttatt 
aggaacttgt 
tttttttttc 
tctctttggc 
cttcttgccc 
cgttcaagtg 
cacgcctggc 
tggtctggaa 
tacaggcatg 
cttttctttt 
ttctcttctc 
ttagaagctt 
cctccacctc 
aagtgtgcgc 
tgttggccag 
aggtgctggg 
gctttaaact 
gagcttatga 
tatatggtga 
ggactccgcc 
taggtgaaat 
atacaactaa 
aaaaaaaaca 
taccttagag 
gaagttaata 
ttgagaaaaa 
atatatatat 
ctgtcgccca 
ttcaagcgat 
gcctggctaa 
ctcaaactcc 
cgtgagccac 
atatttatac 
ggtgggagaa 
tcagacaatc 



ttatggaagg 
agagaataca 
ccagaaagga 
cactgaatct 
atggactatg 
gggtttaact 
tattttcaga 
ttttcataaa 
gcccagcttt 
aagtaaaaca 
agatcaaaaa 
agtagtctgg 
agttctccat 
tgtggcttaa 
caattaaaaa 
aagtccttgt 
gcttagatag 
ttacaactag 
tacaaagcct 
ttaatattag 
ctgcatgtgg 
gctctttaat 
catcctggcc 
ggaacctaaa 
taggaaagag 
tccaacagtt 
ctacatcatt 
aagctggagt 
gttctcctgc 
taattttttg 
ctcctgacct 
agccactgct 
cttttctttt 
ttctcttctc 
gctttgttgc 
ccaggttcaa 
caccactcct 
gctagtcttg 
attacaggcg 
gtccgttcag 
tttagctggt 
gaacagggag 
cttcccactc 
caggtactaa 
caaattcatg 
acaaacaaac 
tttttattta 
gagagtaaag 
tttttaacat 
atatatatat 
ggccggagtg 
tctcttgcct 
tttttgtagt 
tgaccttgtg 
tgcgcccggc 
tagttgtaca 
attttactct 
aggcagattg 



ctggaaactg 
ttttcaaaag 
atgatgaaag 
aatgaaaacg 
ataggaagca 
gaaatcaatg 
gtatgcaaat 
cactgtgcca 
actgtgacat 
aaacaaaatg 
aaaattaggt 
aatggacttg 
cttgggaaag 
acatccccaa 
gaaacacagt 
ttggataaag 
gttcaggcca 
gattcaaacc 
cccatcttta 
ggaaaagggc 
tggcacctgg 
ttgtgtataa 
acaaatatta 
tttgaaccac 
aataaaatag 
ttacctgtga 
ttcttttcta 
gcagtggcat 
ctcagcct cc 
tatttttagt 
caggtgatct 
cctggccggc 
cttttctttt 
ttctcttctc 
ccaggctgga 
atgattctcc 
ggctaatttt 
aactcctggt 
tgagccactg 
gagatcccac 
tctgtcatta 
aagtgctgat 
cactgaaggt 
aatggacttg 
ttaacttgaa 
aggaaacttg 
tgcttttgtc 
tcgtctttat 
cattattgat 
atagataatt 
tggtggcgat 
cagcctcccg 
tttagtagag 
atccgcccac 
tgaggtaaaa 
gccatcacca 
gctttttaga 
tctgtgatta 



acaccaaact 
cngatgctga 
aacttcaaac 
agtcagaga t 
ttttttcctt 
cattcaaaaa 
ctcaacctcc 
ttcatgtatt 
acggaaagct 
tgttatcacc 
cagatcataa 
aagaattgaa 
tctgggttag 
artatgaatt 
gcctaaaggc 
attgtatgtt 
gagaggt caa 
caggcagatt 
atgcttgcag 
cagtgtaggg 
aztggaatgc 
cggagaggaa 
atgctacctt 
tgtaaagtaa 
aaagagaagg 
cctttataca 
tttttttttt 
gatctggctc 
tgagtagctg 
agaaactggg 
gcctgcctcg 
ctacatcatt 
cttttctttt 
ttctcttctc 
gtgcagtggc 
tgcctcagcc 
tgtattttta 
ctcaagtgat 
tgcctggcct 
tgcatcctca 
gatgggaata 
ggtaaagtcc 
tgaagagcca 
gcttgagaga 
cctttattac 
attgttaaat 
taccattaat 
gtctttcagt 
atatatatat 
tttttttttt 
ctccactcaa 
agtagctagg 
acgaggtttc 
ctcggcctcc 
tttaaagtgt 
caatctaagt 
ttaagtttct 
gttttggcca 



ccttattcag 

atataaaaaa 

caagcaactt 

tccagt tgac 

tcaa tctgag 

tatgcagtca 

tagtatatat 

tccatgggac 

agtt aagcta 

tgaaaaagag 

tgaagaagat 

caacgccatc 

tataaatttt 

agaatagtat 

act tggggga 

ttctggccaa 

aattacttgc 

gacttggggg 

atttgttccc 

agagatcca t 

atccaggagc 

gtagacaggg 

tatatgacat 

gacttcatag 

ttgtctcctt 

aataactgac 

ccacaagatg 

actgcaacct 

ggactacagg 

tttcaccatg 

gcctcccaaa 

tt ctaaagct 

cttttctttt 

ttttcttttc 

accacctcca 

ttcagagtag 

gtagggacga 

ccgcctgcct 

cagatcatta 

aattcaaaat 

tccttttatt 

tgtgattaag 

tggacaatga 

tcaaaattga 

cctgtgaagc 

tctctttaag 

atgtctgcac 

gcttacttat 

atatatatat 

tcttgagacg 

tgcaagctct 

atacaggctc 

accatattgg 

caaagtgctg 

acaattcagt 

ttagaacatt 

gtctggatct 

ttccagcttc 



ccaaagacac 
ct tcatagtt 
cagtcaaaza 
tcatcatcag 
aagaaacaag 
aaggttgttc 
aacgcgtcag 
caggaatatt 
ctttctccaa 
aagcagatgt 
gagaaggcct 
aaatatacca 
ataacttggg 
ttcatat ata 
cacatttacg 
gtaagcttga 
ctgagattgc 
ttcatcagga 
cagttaccga 
ggcatgaggt 
tgcttaccct 
caactagtgc 
aagtcactag 
tgataaagag 
ttgtagattt 
aaagcattaa 
gagtttcact 
ccgcctccca 
catgcaccac 
ttagccagcc 
gtgctgggat 
ccagaccatt 
cttttttctc 
tttttttgag 
ctcactacaa 
ctgggactac 
ggtttcacca 
cagtctccca 
ttttctgtta 
atctaacact 
tccttgaaat 
atagcaataa 
gaagtcacag 
tcacttggtg 
atggtgatta 
tcagaatatg 
ctgctcttta 
atttgggaag 
atatatatat 
gagtctcact 
gcctcccagg 
ccaccaccac 
ccacgctggt 
ggattacagg 
catttttagt 
ttcattaggg 
aatcatttaa 
ttcattggtt 



10980 
11040 
11100 
11160 
11220 
11230 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 
13920 
13980 
14040 
14100 
14160 
14220 
14280 
14340 
14400 
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gttaacttt c 
atgtgccata 
ctaattctga 
atggtataac 
ctcctcaaat 
ctttgggaag 
aaaagagaac 
tgatatagca 
tcacctaaat 
agctttgaat 
gaagagacta 
taaaattcca 
tgttacatca 
aagaatgttg 
ataaaatatg 
taatattgta 
aacttggtac 
tctaatgtat 
agtatgcatt 
tctgtgttgt 
gcatatacca 
ttttggctgc 
ctcttttcag 
aaatctttaa 
tggcttttaa 
ttgtttcagt 
ttaattcttt 
ggtggggt cc 
ttgcttgagg 
aaaaaattaa 
cgggaggctg 
tggtgaaacc 
aatctcagct 
gcagtgagcc 
caaaaaaagt 
ctcaggaggc 
gctatgattg 
agattattag 
gcaggcggat 
atgtctacca 
tgaggcaagc 
actgcactcc 
tcctgtcttt 
ccacattatg 
ctaacagatg 
agacctgtgc 
ttattaggaa 
attcattact 
gtattttatt 
gaagaattta 
ttctatttaa 
tatgtgaata 
atctttggcc 
ggcggatcac 
atacaaaaaa 
tgggaggctg 
tccagcctgg 
aaataaattt 



acaaataaag 
gtttaaaaga 
agattatgta 
aatatctgaa 
tcatatgtcg 
tgattaggtc 
tgtgagaaat 
gcctgcatgg 
tcatagaagc 
atatttatat 
aatatagaaa 
agatctctaa 
aaattctttt 
tattcctttt 
ccatgttcgc 
caaccatcac 
ccattaaaca 
attgtgtctc 
tgtcttatgt 
atgtatcaga 
catttgttta 
tgtgaataat 
ctcctttggg 
taaatgataa 
gagattgatc 
attaatattg 
ggatactggt 
agtggctcac 
ccaagagttt 
aaaaaaaatt 
agatgggtgg 
ccatctctac 
actcaggagg 
tagatctcac 
aaaaataaaa 
tgactgaagt 
tgccactgca 
gccagacgtg 
cacctgaggc 
aaaatacaaa 
gaatcgcttg 
agcctgggcg 
atcgtagagg 
gtagatgtat 
tttcttcagg 
ctatagaaca 
gatcagatgt 
attccttttt 
catggctaca 
ttaagctgga 
atagttgtac 
gtgaaatata 
gggtgcagtg 
ttgaggccag 
atacaaaaat 
aggcagaagg 
gcagcagagt 
gacatttaaa 



gctgctcaaa 
tgggtttggt 
aagaaaagga 
car ccatctg 
aaatcccaac 
atgaaggtga 
aagtt tctgt 
actgagacaa 
taatatatca 
ttttgtttat 
tgcatgccgt 
agttacaacc 
acacgttttg 
tgatacaaat 
catttttaag 
cactatctat 
ataattcccc 
tatgaattta 
atctgactta 
atgttattcc 
tccattcatc 
gctacagtga 
atatacctag 
cacaaatact 
attttgccac 
tagcctaaaa 
agagtcagga 
acctgtaatc 
gagaatagcc 
aagccaggcg 
atcacttgag 
taaaaatacc 
ctgaggcagg 
cactgcactc 
attagacaca 
gggaggatct 
ctccagccta 
gtggctcatg 
caggagtttg 
aattagctgc 
aacccgggag 
atacagcgag 
gaggaaaggg 
cactgggcat 
ctacactgca 
tgaacatcct 
taaaataagg 
ctggcagcct 
gcagtctact 
aactaaagat 
atttttaatt 
attatgataa 
gctcatgcct 
gagttcgaga 
tagcctgaca 
atcacttgag 
gagaccctgt 
atcttaaatt 



gattagaaat 
gaatacagtc 
aagaaatgta 
gtcacaccgt 
tcccaaggtg 
agccttcatg 
cgtttgttag 
ctatgagtta 
atatttatgc 
ttttaaattt 
agt caggata 
tagagagaat 
taagatttct 
ctttttttaf 
tgtataattc 
atccagaact 
gtccactcct 
cttattctag 
tttcatttaa 
ttttcatggc 
tgttgatgga 
acattggtgt 
gaattatgtt 
tatatttgcc 
gtggttgtaa 
gagtgctaga 
aatgagatat 
ctagcacttt 
tgggcaacat 
tggtagctca 
gtcaggagtt 
aaaattatcg 
agaaccactt 
cagcctgggt 
tgtggtggca 
cttgagccca 
ggcaatatct 
ccagtaatcc 
agaccagcct 
aatgtctata 
gcagaggttg 
attctgtctc 
agaatggggt 
agagaaaagg 
ctcattgtgc 
tcattggatt 
gtgttaaagt 
aaagacataa 
accaccatgc 
ggtgagtaca 
gttcttgcaa 
ttaaacagta 
gtaatcccag 
gcagcctgcc 
tagtggtgta 
cccaggaggt 
tggggggaaa 
atttcatctc 



aacatttaat 
aaatacarac 
gggagaggat 
tggtatttga 
atcgtat zag 
aatgggattc 
ccacccagt t 
ttatgatagc 
t atgaaatat 
cagattccag 
act ccagtgg 
t tagtgagtt 
agttgctt ta 
tgtgttaaac 
aaaggcatta 
tt tccatcac 
ttccccagtc 
atatttcata 
cataatgttt 
tgaatactat 
cact tgggt t 
acaagratct 
taactttttg 
aatgcaaata 
ttaaaaaaaa 
ctgttttact 
tgaacttaaa 
gggaagctga 
agcaagaccc 
cgcctgttat 
ggagaccagc 
gggcgtggtg 
gaactgagga 
aacagagcga 
catgcctgta 
ggagttccac 
caaaaaaaat 
cagcactt tg 
ggccaacatg 
atcccagcta 
cagtgagtgg 
aaagaaaaag 
tggaatggtt 
agcatttaaa 
taactgtaat 
tgtttggtca 
taagttcaga 
gtgaagaaga 
ttcctttggt 
tttgttattt 
cctgtcatac 
gtttttatgt 
cactttggga 
aacatggcgc 
tgcctgtagt 
ctgtgttcct 
aaaaaaaaag 
tgtttcagta 



ttgaatgtaa 
atttaaagc ■: 
tgaaatgttc 
atgt tttgt c 
gaggtgtggt 
gtgctcttat 
taggatatt* 
ttctgttatt 
ctcttaacca 
atgacctgag 
aagttacccc 
caaatatat a 
gctaagtaai 
tatatataac 
attacattca 
cccaaagaga 
cctggtaatc 
tataagtaga 
tcaaggctca 
tccattgact 
gtt tccacat 
gtttgagttc 
agaagctgag 
tgaatatttt 
ttgtcccatg 
ttttactcag 
gatctttgca 
ggtgggagga 
catctctaca 
cccaacact t 
ctggccaaca 
ctaatcctgt 
ggtggaagtt 
gactctattt 
gtcctagcta 
actgcagtga 
ttttttaaat 
gaaggccaag 
gtgaaacccc 
ct tgggagcc 
agactgcgcc 
gaatttgtt t 
attgagtgag 
acttttccgc 
gtcaaatccc 
ggcttacact 
tatgaggata 
cataaaaact 
aatatcagag 
tgactttttt 
ctgtgaacag 
attgaaaaat 
ggccgaggca 
aaccctatct 
cccagctact 
gccactgcac 
tctttaactt 
ctaactctgc 



14460 
14520 
14530 
14640 
14700 
14760 
14820 
14880 
14940 
15000 
15060 
15120 
15180 
15240 
15300 
15360 
15420 
15480 
15540 
15600 
15660 
15720 
15780 
15840 
15900 
15960 
16020 
16080 
16140 
16200 
16260 
16320 
16380 
16440 
16500 
16560 
16620 
16680 
16740 
16800 
16860 
16920 
16980 
17040 
17100 
17160 
17220 
17280 
17340 
17400 
17460 
17520 
17580 
17640 
17700 
17760 
17820 
17880 



WO 99/67395 



PCT/FR99/01513 



42 



atttattact ttctttttaa taggactgaa ggaattttct ctgagtatag ttcattcttg 17940 

ggaaaaagaa aaagataaaa atatttttct gttgagtccc aatttgctgc agaagactac 18000 

aatacaagta atagcatgtt attgaatatt taataaaata ctatttgtta catatgattg 18060 

ataataaagt atgaagttcc ttgtaacacc ttgcattgtg aagtgtatta aaaacctgct 18120 

aagagtaagg aataacttga tttaaaatar tttattcrgt aatctcttta aattatctgt 18180 

acaaattatt gacttaacct aaatttaaaa atgaatgcct tagcacaatt aagttccaag 18240 

aatagagttg atcatgttaa ctggtaaatg gatcatgatt taaaattctt ctaggattga 18300 

aacaaatgaa aacgtagttt taagggtttg attttttaaa ttcctatttt tacatgcaat 18360 

tttactgcac aacccatctt attttgacag ttcttaaatt cgcaactctt cagaaatatr 18420 

atcagatcac ttttctttgc ttccataagt ttttttatta ttatattatt attttttttt 18480 

tttaaaagac ggtgtctcac tttgtcgccc aggctggagt gcagtggcat gatcatggcr 18540 

cactgcagcc tcgacctccc aggctcaggt gattctccca cctcagcctc ccaagtagct 18600 

gggaccacag gcgaatgcca tgatgcctgg ctaatttttg tatgttttgt agagaraggg 18660 

tttcaccatg ttgcccagaa ttgtcttgaa ctcctgggtt caagcagttg ttctgccttg 18720 

cccacccaaa gttgtgggat tacaagtgtg agccactgcg cccagctatt ctagaagtat 18780 

tttaagagtc atcttttttt tttttttgag atggagtctc actctgtcac ccaggctgga 18840 

gtgcagtggc acactctcgg ctcactgcaa cctccacctc ctgggttcaa gtgattctcc 18900 

tgcctcagct tccctagtag ctaggattac aggcgcatgc caccatgccc tgctattttt 18960 

tgtagtttta gtagagacga gatttcacca tgttggccag gctgctcttg aactcctgac 19020 

ctcaagtgat ctgccctcct cagcctccca aagtgctggg attctaagtg taaaccacca 19080 

cacccagcca agagtggtct ttttacaata ttattttttg attaggacat tcattcttgt 19140 

cataaaattg aagatactct agtcatttag aatttcattg ttttggaact agacattgtt 19200 

tctttatttt tgaaatgtta ttgaaggaat accatttgga gaagatacaa atgtaagaat 19260 

tgtgaaaagg ataattgtga cacaaatcaa aattatagat aaaaatatac ctgtaaaatg 19320 

tattaaggca ataacattct ttctgcttgt tgaccataaa tatttatatt ccctggatgg 19380 

gtacattgtt attgtcaagg gtgtttaaat aatgatcttg catgcataat ttattctctc 19440 

tggtataaca gaatcagcaa tttagttttc tgggacccga gaaaaacatg caaaagacat 19500 

actttgaaat gtaaaactga tttttccttg caactgtagg tccttctaga tcctatggta 19560 

aaagaagaaa acagtgagga aattgacttt attcttcctt ttttaaagct gagctctttg 19620 

gggtaagaag ttatggccaa actagcatgt tagacatgtt tttaacacta tatctggcag 19680 

agttttcaat gtaaatatta aagtagatgt taatgtcaat aagtgatctt aataatgcat 19740 

cagtagatat tttttcaagg attgtctcta tcttcacgcc tagcttataa tttgccttgt 19800 

cgtctttttt tttttctctt tatttttatg tttttatcca tccctggtgg taggggataa 19860 

ccttgtcttc ttcgataaca agaagtctga agcttattag aaattttact ttgagaattg 19920 

atcgatgaga agaaagcaac tagatatcac gtggatcata tatgcttgaa taaaacaata 19980 

attcttagaa caaataaata cattttaaaa gttaaagcca aaaacattag ttgaatgttt 20040 

aaaaatattt caaattaagt tattccttca ctgtcttgta ttactgtaat aatttggatt 20100 

atttgtgttt ttctcaactt ttaaaacaaa tatttaaaaa attcctcttt tgattaagta 20160 

gggctagata aaatataaaa aatatttttt aaactcctct taatttccat atttcttata 20220 

taatatgaga atctcttata aacactacct cttagaagtc tccacagaag ctttggtaga 20280 

tgtagtagta gggatttgat ttcttagaat ggtataatct gtaaatgttt tagtaaaagg 20340 

attaaacgat aaagtcaaaa tgtttatagc acagtgttta ttaatataaa ataaaatctc 20400 

tttttttttt tttgagatgg actctcactt tgtcactcag gctggagtgc agtgttgcaa 20460 

tctcagctca ttgcaacctc cgcctcctgg gttcaagcaa tccttccgca tcagcctcct 20520 

aagtagctgg gattacaagc atgcaccacc acacctgcct aattttttgt atttttagta 20580 

gagatggggt ttcaccatgt tggccaggct ggtctcaagt gatccgcctg cctcagcctc 20640 

ccaaagtgct gggattacag gcgtgaacca ctgtgcccag cataaagtaa aatctcttca 20700 

gactctcatg tgatcatgta aagtggcagg cagtcacagt caagaagtag tttaaagttc 20760 

atgtttgtaa aatataatct acagattgat actggatttc ataggtaatg tttaagagaa 20820 

aataagtttt tagttatcct cagtacttca aaagcaccca tttatgatta tgttgattac 20880 

taaactaaat catttggggg ctagaggtgt ttttttatgt gttaagattc cttaaggagt 20940 

tctattaggg caaaactttt agtaactgca tattttaaaa gtaataaaac taattttaaa 21000 

agcttggagg ctgggcgcgg tggctcacac ctgtaattcc agcactttgg gaggccaagg 21060 

cgggtggatc acttgaggtc aggagtttga gacgagcctg agcaacatgg tgaaaccttg 21120 

tctctactaa aaatacagaa attagccagg tgtggtggtg ggcacctgta atcccagcta 21180 

ctcgggaggc taaggcagga gaattgctcg aacttgggag gcagaggttg cagtgagccg 21240 

agatcatgcc actgcactcc agcctgggtg acagagcaag actccgtctc aaaaaaaaaa 21300 

aaaaaaaaaa gcttgaagtc agattcgaca ttaatcagta tactttctct caagtagggg 21360 
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acaatttcta 
gtctataatc 
gagactagcc 
cccaatcagc 
aggaggatca 
ctccagcctg 
taaattaatt 
cctgcttcag 
ggcgtatcct 
ctgatgtctc 
agtggttaag 
gggttttgac 
gacatatgga 
ggggagtgat 
aattatatgg 
tgttgaacca 
ctacattgct 
agtgattagt 
aaatctggcc 
agaggttgta 
tgtgactgaa 
aactttagcc 
agttgactgt 
cattagaaag 
tagtctttaa 
tttgataaaa 
aactttttgt 
ttagaatata 
ggttgcttca 
accatataac 
aaaaaatatt 
catatagttc 
gtaactcacc 
ctaggcagat 
ttttcccaca 
aaactgggta 
ttcttttttt 
tgcgatctcg 
ctcccgagta 
tagtagagat 
gatctgcctg 
cctccttttc 
ttgaaccatg 
ttttatagtt 
cccagcactg 
aaaacataca 
ttgtcctgct 
acagtcctga 
ttaaggtctt 
cagagaataa 
agttgtccta 
aacttcatgg 
atttactctt 
caaattctag 
ggctactgtg 
atgaagatat 
ccagggtgac 
gtaggagcat 



agattttagt 
ccagcacttt 
tgggcaacat 
tgggtgtggt 
cctttgccag 
gatgacacag 
aactacactg 
tcttttatca 
ccttggagca 
ttgttgcagg 
gtgtgt teat 
catctattat 
aagcattcat 
gacgaataag 
tttttctttt 
gecttgeata 
gagttttatc 
ttgcagtttt 
tcataaaatg 
taaaattgag 
tatattggga 
aaagcaatct 
aaagctttac 
acaggaatgt 
cttttctgtt 
tttctaaaac 
agactacatt 
ctctaattgg 
ggggagagaa 
acttttgtac 
gggaagattt 
caactaatca 
aggaagtttg 
geatttgeat 
tcctactttt 
taaatgaata 
ttttttttga 
gctcactata 
attgggacta 
ggggtttcac 
ccttggtttc 
tgagttttat 
ttgatgaaca 
aaatcaatat 
aaatgatact 
aaaaacccta 
ggatgacctt 
tgcggtgcag 
gttcttttgt 
tatatgtgtt 
tagactgtaa 
ttagtccttt 
ttgttcattt 
gagaaaaaga 
tatgagtagc 
tccctgggct 
caacaaggag 
ataacctaaa 



ctt ttaaaat 
gtggggccga 
ggcaaaaccc 
gttacactcc 
ggcgtttgag 
caagcccctt 
ggaaggcaaa 
tgtaactatg 
catcactcac 
acttaggaat 
ttttctgtaa 
atagggtggg 
ttattcacta 
actgatgttc 
ttaggctatt 
cctgtgataa 
tgctaatgtt 
ctgtttttgt 
agatgggaag 
gctgaatctt 
att cctataa 
gtaaagaagc 
gaggtatgag 
tatacataat 
tatcatttag 
tctccatatt 
tctggaagtg 
tataaatgat 
agtaggaggc 
ttttaaagtc 
tactttgaac 
tgaacttgtg 
aagecaaatt 
ttgattttaa 
tttattttgt 
catgeataca 
gacagagtct 
gcctccacct 
caggtgcatg 
catgttggcc 
ecaaagtget 
aaaatttgat 
agtttttgtg 
cgagcttttc 
gaaaccattt 
gaggtggctt 
gacctcattg 
agccagcggc 
cagtcagcat 
atgttaagtg 
tagcaaaatt 
agggtttttc 
gacaaatatt 
agggtgaaca 
cagccctttc 
ttacaggtca 
atgacagcat 
ctgggggtga 



t tattaacta 
ggcagatgga 
cgtctctaca 
tgaagtccca 
getgeaggga 
tctcaaaaaa 
attcagcatt 
tatattttrt 
agcctcctgg 
ggagctct tt 
catttaataa 
ttttgaccat 
atatttctgt 
tccatgccct 
aggtgttgat 
ataccaegta 
ctgttgagct 
gttgtctttg 
tattctctcc 
ggtggttgcc 
agcaattatt 
atttgacaaa 
tatggtaaca 
gctgtcaatc 
tcattaaaat 
taatggaggc 
ctcactgaca 
ctctgaattg 
tgtggacagc 
cttaacattt 
agttaatttt 
tatttcctgt 
tgtgtttcaa 
atgaatcttg 
tgtaagecat 
ggaattatag 
tgctctgtag 
cccaggttca 
ccaccacacc 
aggctgatct 
gggattacta 
actttactgc 
atgggtatat 
tagtgettte 
catatcttct 
tctcagaggc 
ctggactgcc 
ttgctcatgg 
ttttagtctt 
ttgtgtttga 
ggtagagtaa 
attctccctt 
tgtcaaatgc 
gtattagege 
ttggctttct 
ataaatggaa 
acactatgeg 
ggtgggataa 



gtctgagcat 
tcacttgagc 
acaaatgeae 
getacteggg 
gctgggttca 
aaaaagataa 
tttttatagc 
acagaggagt 
gacgccctt t 
tactcacagg 
cttttcattt 
ctattatata 
gtgtctgctt 
ttttctgtgt 
agggttgagt 
gttgtggtgt 
tttgtccatt 
tctggttttg 
tcttcttttg 
acaatgacag 
ttctagggaa 
ctggatgccc 
ctctatataa 
taataaatac 
ttctttggct 
ctattttttt 
ccactctgaa 
ctatggaaaa 
aatgaggaga 
acattattat 
tcccccatgg 
tctttgtaaa 
atatagcaac 
atcccttact 
ctaaaattct 
tagcatattc 
cccaggctgg 
agcaattctc 
tggctaattt 
caaactcctg 
geataageca 
aegctttgag 
taataaaata 
aaaaggacaa 
gtattaagga 
agtgtggatg 
tgctgtcccg 
taaatgeate 
aacaataaat 
ggcccctgat 
aaacagtgtg 
acttattgtt 
ttgtgcacag 
agaacgatac 
tggattgett 
attcagagag 
agaagtatac 
ggagttatca 



ggtggcttgr 
ccaggagtrg 
acacaaaaaa 
aggctgagee 
caccactgcg 
aaaattaaar 
taaattttat 
gaat tcctt a 
gtctcggcag 
aggaaaggta 
atctttctt: 
gggtttatac 
ttaggtgttg 
cagttgatac 
aacttacaaa 
atcattcttt 
taagtttgaa 
ctatccgtgr 
tttttttgga 
gaactattr c 
gtggaaaatc 
atgtggagag 
atcccttttt 
acatatcatc 
ttctaatgtt 
ttctagccag 
aaattagtac 
ctgggagaat 
attacagttc 
ctattcaatt 
gtaccgctgt 
tttaaacttt 
tccaggatct 
ctcacttatg 
caatgggatg 
cttttctttr 
agtgcagtgg 
gtgcctcaac 
ttgtattttt 
acct caaagr 
ctgcacctgg 
actgtattaa 
tagatcaaat 
cctgaatttt 
aaaaggcttg 
cagccatctg 
gaacatgagc 
caccactggc 
ctactctctt 
ggcattctac 
aaaattctgc 
taatttacag 
tctgtattct 
taataatgat 
tgtattctac 
attaatttga 
acagagtagt 
gggaaggctt 



21420 
21480 
21540 
21600 
21660 
21720 
21780 
21840 
21900 
21960 
22020 
22080 
22140 
22200 
22260 
22320 
22380 
22440 
22500 
22560 
22620 
22680 
22740 
22800 
22860 
22920 
22980 
23040 
23100 
23160 
23220 
23280 
23340 
23400 
23460 
23520 
23580 
23640 
23700 
23760 
23820 
23880 
23940 
24000 
24060 
24120 
24180 
24240 
24300 
24360 
24420 
24480 
24540 
24600 
24660 
24720 
24780 
24840 
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tttggaggag ttgacaactg agccgagttt tgatggaaga gtagaaatra gcatgaacca 24900 
atttcatgct aataaagaag caaaggaagc gtggtctaca ggcaaaagca cagaggtaca 24960 
ggaagtaatg atatgttggg gaacaccctg ttgactggag cttagagtgc aaggagagga 2502C 
gtgctaggga ggtgaggttg gagggtttgg cagcattgac ttgctLcaag gctctraaga 2508C 
gctgaaatag atataaaatg caactaagag tggcttggat tattattacc tagtgtgtta 25140 
atctcaaatt ttgaaatcta tagcatctat aggactggtg ttactaancr tacactcgan 25200 
ctgttactgt tcttatacta gatctattag tccagtgttt aagggagtgg tgcagatttc 25260 
taggtcagga caggactcag atgtacatta ttaatgccta tttcagttcr gaccttctca 25320 
tatgaaacct tataagacct ggggtaggaa gagattgttc tggaagtcar aggaatatga 25380 
actgtatttt gtttaacaaa caatacagta tggaaattta tcacccttcc agaatattta 25440 
tttcagagac aaatttttat cattcgttca tttatttcat aagatccacg agtagggaac 25500 
ctcactagac attgctctga gtatatggtc tgagtttgca gtacctcttg tgtctcca" 25560 
agatttatta ggtcctcaat agataaatca gggaataact agatggattc attttttaaa 25620 
gacatgaaag agcgatacca tacatactgc accttaaagg tcaaccttag agtatcatra 25680 
tttttaatga atgtataatt tttaaatttc atgtttactt ttcctaagct tttgcactar 25740 
attgcttaat tccagctttg aatgatatga taaaagagtt tatctccatg ggaagtttgg 25800 
ttgcactgat tgccacaagt cagtctcagc aatctctaca tcctttactc gtttctgctc 25860 
aaggagttca catatttcag tgcgtccaac acattcagcc tcctaatcag gtaatacact 25920 
acttgtaagg attattgaat tatgtccctt ttatagaaat tatttttcaa ttttattagt 25980 
aattcgtggc tttaaattta tgcttctctt aatgatttta aggatatgra agtcaacatt 26040 
tggtgcatat tgtgctagag gcataaatta taatttatag ccacctgaaa tgttagtatg 26100 
cgctttccaa gaaaatgact tttttgaaaa tggtatttct ttgaatgaga aagaacagag 26160 
agaaatagat agatggcttt taaacacttc attaattaaa cttt tttttc ccaccatcac 26220 
ataatggcac ttagtcccct ttgggaactc atgagggttt tagtggtagt gagctgaaag 26280 
aaatatgttc caggactggc aaacatattc taaattcttt aaaattttca cctagcatct 26340 
accctaaata ttcagaccct gtgctagtta actgctattg aagaacaaag gtattatatc 26400 
tattattaag gataatagaa tggtatttga gatattggtc attgaatatg aatatgtttt 26460 
gagaaataag ttttatagga accaaaaaaa aattcttaaa ggaaccatat attactaaaa 26520 
atgcttctta ttggagaaag aaatgacaat catttattaa tgtgattttr tcacaacttt 26580 
attaagatat aatttaagta caacaaactc acataaagtg tacaatttga tcagttttaa 26640 
catatgtaga tgccatgaaa ccatcaccac aattaaggaa acaaacattt tcatcactcc 26700 
agaagtctcc tagccctttt actacccatt cctcccctgc tccatcccca gacaactacc 26760 
aatttgcttt ctgtcactat agatttgtca acctgatttt ctccaaatat acattcaaaa 26820 
atatacagtt gaatacaatt ggaaattcga attttgtgtt tttttcttta ggaacaaaga 26880 
tgtgaaattc tgtgtaatgt aataaaaaat aaattggact gtgatataaa caagttcacc 26940 
gatcttgacc tgcagcatgt agctaaagaa actggcgggt ttgtggctag agattttaca 27000 
gtacttgtgg atcgagccat acattctcga ctctctcgtc agagtatarc caccagagaa 27060 
agtatgtttt actattaaaa cctgaacttg gaatcttctt tctattgtgg agaaatgtaa 27120 
ttgtagtaag acaagaatta aatatattcc attgtagtat ttgaataagc agttatttga 27180 
gtagaaaatt agtgtttcca gctaagatga tggcatattt tgaaaattca tatagtgaat 27240 
ataactagta aaagaagttt tgtttatttt taaacagaat tagttttaac aacattggac 27300 
ttccaaaagg ctctccgcgg atttcttcct gcgtctttgc gaagtgtcaa cctgcataaa 27360 
cctagagacc tgggttggga caagattggt gggttacatg aagttaggca gatactcatg 27420 
gatactatcc agttacctgc caaggtatgt ttaaaaaaag aaaaagtgaa tacttactcc 27480 
cagaagaacc actgtattat tggctttggc tttatgtgtc agcttgccca atctccgtgt 27540 
gagtcaacaa gtgtttactg agttaccaaa taaatgtctt aacactattt taggtacttt 27600 
aacaaatttt aattttatta attaattttt tattagaatt gagacctcac tctgtcatct 27660 
aggctggagt acactcacag ctcactgcaa cctcaaactc ctgggctcaa gcaatcctcc 27720 
tgcctcagcc tccccagtag ctagaactac aggcatgaac caccatgccc ggccaactct 27780 
ttaattttct tagagacgga gtcttgctat gttgcccagg cagacaga^t traatgtgta 27840 
tgatgcagtc tttgatgata agaaacttat aatggaaagc tgaggtgata gttacagtaa 27900 
atacattttg atgtataatt ctgtttgctt taatcattca aattgtagta aagcaagatg 27960 
aactgtctgc tgggatttga gcagaaatgg ataggaataa actaggaggt agaagagtta 28020 
tcaaggttca caggactgat gggtgaagct agatttccag acccgggatg tcagtccttg 28080 
aaaagcagac ttggcaggca tagacgaggc agatagcagg ataaaggaga caaatgtaga 28140 
ttgttcttca gaagatcaga tggtagagtc taggaggtag tgtgttttaa tcagagatct 28200 
gagaggcaaa gatcattgca tgagatcagg gacccatgca aaggagtgag aaaaaaaact 28260 
gggttaagga gcctgctgca tggcaactcc tgggaacagt ggccactggg gcctgggaca 28320 
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tgttgattgc agcccaggac tgttaaaacc agtgtgagag aacatgggta tggaag-act 23380 

agctagcagg atcatgaccc cgatgctggg atggggcatc aagcattagt acatggacat 23440 

tcagtacatc cagatgcagt acatggagac tatatgcgta actgcigaci 1 1 gggc" zt 235CC 

ttcagattgg agcagaggta gaggtgagtg ggaatattct caatagaggg aactaaazag 2356C 

gcatacctaa taaaggagac caggatattg cagacagtag cctcatgttt ggctcacctg 2362C 

ttcaaaaagt tctcttgttc ttgagcagtg gtgccttaaa aggtaacttg agaagcagrc 2868G 

gattatttgt tcagcctgga gactcttggg atattttact atctttgatt gaatagatrt 28740 

aaatgtacac agctctcata acttgcccca tgaagcatat ccatgaaagg cactatactt 28800 

gttaaaagat tggtttgtac tttttaaatg tagtactttt aataaaacag gaaaaataga 2S860 

agttctgatg cagttatatg cattttatat agaatgtgtt cttaattgga aaaaattrgt 28920 

cgtagttcct ttgagttcat ttacagtttt tagtaggaat tgtattttct actgttgrac 28980 

ttgctgttac taaagaaaga tggtcgtgat taccatctga attttttttc tatacattga 29040 

tctttagctg ctacttagtc atttctgttt agacttgagc tctttttcat attttttctt 29100 

tttgtttctc agtatccaga attatttgca aacttgccca tacgacaaag aacaggaaca 29160 

ctgttgtatg gtccgcctgg aacaggaaaa accttactag ctggggtaat tgcacgagag 29220 

agtagaatga attttataag tgtcaaggta tgttgtctac ttatcttctt tttttat~ta 29280 

ggtaaaatta acataaatgc agttagccat ttcaaagtgt aaattcactg gcatttagtg 29340 

cattcacaat gctatgcaac caccacctct ctctaatttc aaaacttttt cattccactc 29400 

ctcctcttgc ttatcccctg gcaaccattc atctgctttt tgtctctatg gatttgcctt 29460 

ttctgtatat ttcatataaa acaaatcatg caatatgtga ccttttttgt ctggctrctt 29520 

tcacttatgt aatgttttca tggttcatcc aggtagtagc atgtatcag- acttcarrcc 29580 

tttgcatgac tgaataatgt taccatactt tgtttatcca cttatcagtg gtgaacarcr 29640 

gaattgtttc taccttttga ctattatgaa taatgttgct gtaaatattc atgcacaaat 29700 

ttctccacgg atatgttttc atttctcttg ggtataaact gaggagtaga attcttgggt 29760 

cttagggtaa ttctctaact tttcaaagaa ccaccaaact gtctttcaca ccaactgcac 29820 

cattcccact agcagtgtgg ggggttcctg attctccaca tctttaccaa caccattarg 29880 

tttctcaatt gtgggctagt ctcacatttg gaaagctagt gggagcagcg atccatctat 29940 

taaaagttgt atgaaattga gtaatgagcc acctctctct tgtagggctt attatgtrct 30000 

tgcttaaggc aatcttcatg cattgtgaac agaattatac ataaatgctc agataaaagg 30060 

gcaaaccatt cttaaaggga gtagacaact agaggcagga gaccaractg aggcaggaag 30120 

ctggggtttt tatggttctg ttacttttga ctatatctca ccattgcttt tgtcaaagtg 30180 

agactaggtc taagtttttt tcaggtataa ggtgagtgtg gtaattaagg ggcatgctag 30240 

cagatcattt tgggtaatgc ttcacagtcc accactggtg tgtcattgtg gtcgcagatc 30300 

cagtatctta gctgtgtaat ttcagacatc agcaatatta gtttaacaaa gggcaatrag 30360 

attccaagac aaaggaatcg tgtattattc tagccttatt caaacttgat ttataaatca 30420 

gtttagtaat ttatttattt gtttctgtat ttatttttat ttctttgaga tggagtcrca 30480 

ctctattggc caggctggag tgtagtgatg caatcttggc ttactgcaac ctctgccicc 30540 

tgggttcaag ctattctcct gcctcagcct cccgagtagc tgggattaca ggctaatrrt 30600 

tgtattttta gtagagatgg ggtttcacca tgttggccag gctggtcttg aactcctgac 30660 

ctcgagtgat ctgcccgcct tggcctccca aagttctggg attacagacg tgagctaccg 30720 

tgcccagctc agtttagtaa tgtataactg ggttttaccc agttgtaaat tactctt ttg 30780 

tcgtgttttt ttgagaactg gcaatgacgg agaaactaaa agtgccaggc tgttgccttg 30840 

ttcctgttat tttgccttag tttttttttt tttttttttt ttctctgaga ctgagtcttg 30900 

ttgtgttacc aggctagagt ggagtggcat gatctcggct cactgcaacc tctgcctcct 30960 

gggttcaagt gattcctgcc tcagcctccc gagtagctgg gattacaggc gcctgccacc 31020 

gcacccggtg aatttttgta tttttagtag agacgggatt ttaccatgtt ggccaggctg 31080 

gcctcgacct cctgacctca tgatccacca gcttcggcct cccaaagtgc tgggattaca 31140 

ggcgagaacc accgtgcccg gtcttgcctt agttatttct tgttccctcc tctagtccta 31200 

tagttctctg actgtattga ggaaatgtaa ttaaatatta ttatgttaat agatattrat 31260 

gtggttgaat attagaaatt ccttattttg gtcacatatc ctgatcagta gttggtcttc 31320 

tggagatagt gatttttcac tagagatgac tttaggacct attcaggttt tttttaagat 31380 

cccaatttaa ggaaagacta ttctcattat tgattttgct atatgcaggg aaatttautt 31440 

cgaaaggttt ttcagttggc ttttagggaa gattatatat tctctttttt tttttttggc 31500 

cttttcccac atgttctaaa aatgatatat tctttaactc ctatgaaaat acattgtttc 31560 

agtaattgaa gatgctgatt aaagtcatat ctctacacat tttttaaaat ttgagataga 31620 

tgggactttg tcccttctta caccattcac ttattcactt ggaaaaacta ttatccaata 31680 

cttatgtggc agacactgtt tctggcacaa gggattcagc agtgaacaaa actgcctitt 31740 

tggagtttac attctactag tggaaagcga caacaagcag atagacacat tcagtatata 31800 
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attcactgtc agatggtggt ggtaagtcct 
tggagtaact ggagrgagtc atagatggac 
atttgggcag agatctaaat aaaatgaagc 
gttctgggca gaagcatcaa gcatagaact 
aattttaaaa atgtataaaa gacatccatt 
tagacttagt cagaaaccaa atttatattt 
ttttacccaa taggggccag agttactcag 
tcgggatatt tttattaggt tggtagccta 
ttatttatca atcagtgctt tttttggtct 
gtggtttatg tgaattatta ataagctaga 
acaaaacatt ttagatatta aattttggaa 
ctcctcaaag tggaatcgaa gtggttattc 
agcaaataat tgcccctaat ttatctctaa 
cagtttctaa tttatctctt ataagtcaag 
tgtaactatt ttgcatatat taaaaaactg 
tgaaaataat tattcaaatg tgatagcatt 
ttattcttcc aaaaatttta ttataaagta 
atgcagctta aggaagaata ataaaatgaa 
ggaaaaagca taaacaaaat aaacctcttc 
agtggaaaat atttgggagc aaacgataat 
ttgcaaaact gatttcaagg aaaatttata 
agaagttaac cacttatgta tctatctcat 
aaaatatgtt aaaagggaaa taataaagat 
agaagctcac aaagccaaga tttatttttt 
caagtttgat taagaaaaaa gaaagcatga 
atcgctaaag atatcccaga aatgtaaaag 
gccaatacat ttgaaaactt aggtgacata 
aaaaagaaac aaaatctgag tagtcctgta 
agaagtcttt acacaaatca aacatcagac 
tcaagtagca gataattctg gtctattttt 
catttaatga gatagctgtt gatttttttc 
gttattcgcc agacatctag tccacctgtt 
tgaattaaaa tttgttaata aattaataaa 
taaaagaaat aaaatatatt ttatagagag 
tttccaaatt ttgaatgggc aaaataaatg 
gccaataagt atatattaat ataaaaatgg 
cttattgact aagagtcagt ttttgttttg 
tcttaataaa caccttgacc tcaacagttt 
gccttcttta agggtttgtt gtaaagatta 
ttatatgtat ttatatgtaa ttacatacaa 
ttaaaagaag tatataaata tatataaata 
gaaatcactt tgccaactat gaagcctgat 
gagcacaggc tgcaaagccc tgcattcttt 
ggcggggtca tgataataca ggagttacag 
tggatggagt agaaggctta cagggtaata 
aaaatgtcat catgtcatca gattttggta 
atgtattggc tgctactagt cgccctgact 
gactagataa atgtgtatac tgtcctcctc 
ccaaaaccca acaaatgcta cactctttcc 
aattgtcctt agaagaccag ctttcttagg 
ataaaaagat tctgaattag atgcaaagcc 
ttgtaatcct tctgtgttgg ctgattgggg 
tattttcaca ttatcttctg ttcaaagatt 
actctgatac agaatcaagc atgtgaatcg 
tttttcaact cttccttgtc ctgtgttgtt 
caaataaatg aatgaaagaa cagatagaca 
atatatgtta catgtagcta ttatttaaat 
tggcacactt gcctaaatct agaaaataag 
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atgtaggaag aaaagcaggg taaggaggct 31860 
ttgtcaggaa agggtttctg aagaggtggt 31920 
aacaagccat gagaatatcc gggggaaaat 31980 
tgtggtatga tatttattct agcacacatt 32040 
taatcatatt aaagatttcc at gat tea tt 32100 
tctttttaaa taattttatc tcaactctta 32160 
caaatacatt ggagcaagtg aacaagctgt 32220 
tgaatgtttt taaagtaacr gactctgtta 32280 
tgttttttga agaactgata tttgaaacct 32340 
ggacgtggat tctctatttc atcaaataat 32400 
attatttggt tttgttttac aatagaaata 32460 
aaagaaatct cagagtagat tcttatatga 32520 
atttrgtaag ttctaaattc ttttttcccc 32580 
agtccatctg gccaatttaa tttcagtgag 32640 
tatatgaata cagaagatgg tatttaagga 32700 
atggggagtt ttaaaataaa agttactgtt 32760 
tacagttaag agaatataca taaaatacat 32820 
tacttcatgt attcaccacc gagtttacca 32880 
cacgtaattc ctgggttaaa gagaagttat 32940 
gaaaatacta tccattaaaa ttgttagatg 33000 
gtgttaaatg tttagaaaag aaaaaaggit 33060 
gaaattagga aaattataga tataaactaa 33120 
aagaatgaag tttaatgaaa cacaaaacag 33180 
gaacaccgag tacaattgac aaatctctaa 33240 
ataaacaatt ttagggataa aaagggaaac 33300 
ataataaggg aatattatga aaatattcat 33360 
gacaaaaaca aaattgacca aaattgagca 33420 
acttagtaaa aattgagtta gaaaagttaa 33480 
tcagttttct aggagagttt tgccaaacat 33540 
ggccccagaa gatatatttt acttgccatg 33600 
aatcaccgtg acaggtgttt tatattaggt 33660 
gccagatatg gaattaatat tcacttattt 33720 
acaaagtcaa agttcaaatt attaaaaaag 33780 
cccttacaaa acagtaccaa cataatgagc 33840 
aataggcatt tcacaaaaga aggaagggtg 33900 
ttacttgtaa taggaatcaa aagtgtttga 33960 
atccctgtta gtctatccag aaggcatggg 34020 
actgaataca agggtaattt catatgcctt 34080 
aaataaatac ataaatatat ataaatacat 34140 
cttgccttct ttaagggttt gttgtaaaaa 34200 
cataaaataa atacattcat atatgtatat 34260 
tcaaatatga aatgttgttt gtttttccca 34320 
tctttgatga atttgaatcc attgctcctc 34380 
accgagtagt taaccagttg ctgactcagt 34440 
attataaata cagaaataga atgttataac 34500 
aaaaaatgtt cttttttcct ctaggtgttt 34560 
tgattgaccc tgccctgctt aggcctggtc 34 620 
ctgatcaggt gacaatttca tatttagagt 34680 
ttgtgagctt tacttctgcc aggtaatggc 34740 
gaaaagcttt agccactgtt tgctcaaagc 34800 
tttttttggc ccagtgcaag tctgaaaact 34860 
aaaaaaaaat gcaagaaacc taatgtatta 34920 
acatacttcc attatcctgt caaaaaaaaa 34980 
taagcatgta agcaggtttc atagagataa 35040 
ccaactctta ttctccaatt tagaagcaaa 35100 
aatgaatagt caaaggtara aagtatctgt 35160 
tatttagatt ttccttttga aataccttct 35220 
cactgtgtga ataagaaatt atttacactg 35280 
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aatattttgt aggtttttgg gtttttgttt 
ctggagtaca ctggtacgat cacaactcac 
ctccccacct cagcctcccg agtagctggg 
attttattat taatttttgt atagagacgg 
actccagggc tcaagtgatc ctcccacctc 
gagccaccat gcccagcctt aagagtgttt 
ttctgttggg gaaaaaattc caaggaagat 
ttacttataa agctttttag atatataagg 
aatttaagat aatattttta attttatttt 
ggtgtcacgt cttgaaattt taaatgtcct 
tgaccttcag catgtagcat cagtaactga 
actttacaat gcccaattgg aggccttaca 
aagttatatg aggaagttgt tatgacattt 
atttccacct taaaaaatgc tattttttaa 
aatttacctt tagttgaatg ttccatagtt 
tatgaagttt gatgtctgtt tctttaacat 
tttgcaagga tattatttaa attgggatac 
tagagttttt tgtttgtttg tactttaact 
ttgaagctca cattgttcca atctggccaa 
tttatgacat gtcctcatca ttcttgaatc 
tcttggccag gtgcagtggt tcacgcctgt 
aggatcattt gggcctagtt tgagaccaaa 
acaacagagt gggatcttgt ctctgtgaaa 
atacctgtag tcctagcttc ttgggagagg 
aggatgcagt gagccatgct tgtgccactg 
tgcccccaaa aaagaaaaat attcttggtt 
catcagcctt ttctctaaag acagtattat 
tgttacatta tagactttac catatatttt 
accacatttg tttggaatgt ctacagaacc 
ttttgctatt ttggcaagcc attgaagttc 
gtatttgtag agctctctat aatgagaaag 
ggagtagaaa agtatgaatg gaaagtcaga 
cttagcttca ttacagactt tcttggggga 
tgtctttata attttaatag ttaaattttt 
atgagctctt tgaaaaatgc ttctaagttt 
gttattattt atttctgaga ctaaaattgt 
tattttagga tggaagttcc agctctgata 
ttaaccatag cagtggctct gacgattcag 
cccttgtttc tttagagatg tccgagatcc 
ggctctactt tggaagctct tatgaatcag 
tatcttgtgc agtcatcatt atacagttct 
tgcagtgatt tctctcctaa ccagccccac 
aaaatagtct tgtttcttgc ttacactaat 
aagacagggc tgggagcaag gaaccaaagt 
ttgaggtttc tcttacctag tggctttaaa 
aaacttaaat tctgttatca tgaacagttg 
aagaaattcc tgaaaacaaa gtgttatctg 
aagtgtactg ataatgtttc aacaggaaag 
ttctactagc attcaacatc tcttctaaaa 
tacatgtaac atctgtacat gtgtttggtt 
tgctttatta atttaggctt tttttttttt 
cagactagag tgcagtggca caattatggc 
tgattcttcc acctcagcct cctgagtagc 
gctaattttt gtatgttttg tagagacgag 
actcctgggc tcaagctatc tgcgtgcctt 
gagccactat gcctagccta actcagactt 
ccaagaacag taaggtggtg gtttaatttt 
tttagaaatg tcccagaaac ttagtataac 
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ttcagacaag gtctcacttt gtcacccagg 35340 
tgcagcctct atggcccagg ctcaagcaat 35400 
accacaggca cacgctacca tgcccagata 354 60 
ggtctccctg tgttgcccag gctttcttga 3552C 
aacctcccaa agtgttggga ttacaggcgt 35580 
gattttcatt cattttccta tatatattat 35640 
aaatagtagg ctgttggtac atttctcaac 35700 
ttaatttatg aagaaaatca taagatacac 35760 
ttatttgtta aataaatttt tctcctttca 35820 
cagtgactct ctacctctgg cagatgatgt 35880 
ctcctttact ggagctgatc tgaaagcttu 35940 
tggaatgctg ctctcgagtg gactccaggc 36000 
tatgagtgat aaaagaagta caatgtcaaa 36060 
acaactttgg raaaactgta tagaaacata 36120 
ggaatatggg ttttgcagag aatttataat 36180 
taccttaata ttggcaaaaa catgttggtg 36240 
catgaattaa atactacaaa caaaaataat 36300 
tttaaaaaat aatcagttaa agttgttgtt 36360 
taggagcccc ttttgtatgg ctcctgtatc 36420 
acttcctcac ttccagatac agtaagttat 36480 
aatcccagca ctttggcagg ccaaggcagg 36540 
tcatggttgc acaaactgta cccactatgg 36600 
aatttaaaaa ttagctgggc atggtggcac 36660 
ctgtggcagg aggatcgctt gagtaaatcc 36720 
cactccagca tggatgacag aatgagaccc 36780 
tatcttgtac tttctgtatc ccagccctag 36840 
gattttaata tttacagtag atatttgaac 36900 
ctaggaagga t tattctatt actcttcttt 36960 
tacagtttct aaatcagaaa ctccctaggt 37020 
ttccctctcc ctttactacc agaaaggtgt 37080 
cactctataa catggttgat tcatcatttt 37140 
gacataaaaa taaagcccag aggtctgagt 37200 
tggttggtaa attatctaca cattctatct 37260 
accatgtgcc tcaaaaccgt tagagaatta 37320 
cttgtattgc tctaatagaa tgctatctat 37380 
ttacatcttt aaactggttg tccttttgtg 37440 
gtgacctaag rctgtcttca atggtctttc 37500 
ctggagatgg agaatgtggc ttagatcagt 37560 
ttccagatga atcaaaattc aatatgtacc 37620 
aacttggaaa tggaacctct tctgatttgg 37680 
gaaatataaa gctatatgtt ggtgtaaagt 37740 
atattcttcc tggttggttg gttcttcagt 37800 
tggtaatttg cattccttgt taagattttc 37860 
agcgcgtggt tgtgattacc tttggtttct 37920 
acatctttag gagcagttcc attttatagt 37980 
aggataatga ataatttgat acaataatgt 38040 
tgatactttt gctgcatagt aagcacaatg 38100 
tgttttgatt aaatgtgggc agtatcactg 38160 
attaatagtg gttcactgta attttattgg 38220 
atctatatgt ttcctggttt tttgtacatt 38280 
ttttttttga gacagtctca ctctatcatc 38340 
tcactgcagc cttgacctcc tgggcttagg 38400 
tgggactaca ggcacatgcc accatgccca 384 60 
gtttcaccat attgcccagg ctggtctcaa 38520 
gacctcccaa agtgctagga ttacaggtgt 38580 
taaaaatata aaagcaattc atttttattc 38640 
agtctttaat tctgttttta atttattcta 38700 
tttactttct gaaaatgaag aaacctgtcc 38760 
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ttgggcatta 
caattttcac 
acaacttttc 
tttattgctt 
tcttcctt cc 
ccaagctcca 
cctccagtgt 
gatcaactga 
tggctttttc 
tatatatttc 
actcagtcat 
acgtatggtc 
tttacatcct 
tgaaccaacc 
cacttggtca 
aagtaacaga 
aaacctttaa 
aaatatgtgt 
attgagtttt 
taattttagt 
aggccaaggc 
gaaaccccat 
tcccagctac 
agtgagccga 
ctcaaaaaaa 
tgaaagtgat 
caaaataatt 
ttcatttgtg 
tggccaccta 
tgattcaatt 
attttgcagt 
aaagaagaat 
ccacctccca 
agtctgtaca 
ttacatttta 
ccacaatatc 
ttgcagctga 
acagggagct 
actgcaccat 
tagaaaaatg 
catattattc 
tccgttttct 
aatttttttt 
acaatccatt 
ttttttcaga 
gtttcgacct 
gttaagtttt 
ttcttcttaa 
ttatgtaatg 
tccatatttt 
gtggaactaa 
tcttggaatt 
gcagcttctt 
ctttgtatat 
aaccagaaat 
taaatgacat 
tatgaactaa 
tatatagtaa 



gtgtgttgga 
ttgatggtgg 
agcttgctta 
aaaatgttta 
atctttcatt 
tgactcagga 
taaggacagc 
gggcagatat 
cccctcatta 
tttgacttat 
ggttatgtgc 
tcttgaaaaa 
taatttaact 
aggaccaatc 
cacaagacca 
ttctgttttg 
agttcgtgtt 
cgtagctatg 
cattaaccag 
aactttgggc 
aggtggatca 
ctctactaaa 
ttgggaggct 
gattgcacca 
aaaaaaaaaa 
tctaatgtat 
tatattaata 
gaccacattt 
tgcatctgag 
taagagatgt 
actttgaagt 
cagaaaacag 
aagcatattt 
tattgctata 
aatgttaact 
caatttttag 
atatatgcac 
cacatttttt 
cactaacatt 
atatcaataa 
attgtcattt 
attggagtgc 
tctagtttgt 
atcttttgtt 
tatgaaagct 
ggacagaaag 
ttgatggctt 
tttaacaaat 
atcaggattg 
atttcctaaa 
tttatttctt 
cccagttgta 
cactgttttg 
caaaaaatgt 
gaaatcacat 
ccattcctct 
attataaagt 
tggggtaagg 



tttaagcaac 
ttctataaca 
atttcagtta 
atttttatat 
actacaattt 
tttgcctgga 
ttcacaagag 
cagtattatc 
taattgttaa 
aaacgagcta 
ttccttgctt 
actgacaata 
cttcgtcaat 
aaaaccagac 
tccattagtg 
gaagtacagc 
taaaataaaa 
cattaaaaaa 
ttcatttgat 
tgggtgctgt 
cctgaggtca 
aatacaaaaa 
gagacaggag 
ctgcactcca 
atttagtaac 
agtttataaa 
ttttattgac 
gttatacatt 
acccatggac 
ttattcctgg 
atgtatgtat 
aggtaaggaa 
gtttatatgc 
tagcagtccc 
actttattgt 
acatttaaat 
atatctaatt 
aaggcttttg 
gtgtgttgca 
tttacatttc 
gtattttatc 
aactttattt 
tatttcccgt 
ttgtaatggt 
ttcaaaatcc 
taactttagc 
ttccatatgt 
ttggttaatt 
agattaatac 
atctaaattc 
ttgaggaaaa 
tattcatcac 
aaataaaata 
gaaatttaca 
ccctctacta 
cctagttcca 
tagccaccat 
gaacagcaaa 



aaagttaaaa 
caggtatcag 
attaacatgr 
ttggtaaaca 
accatgcaga 
gttcctggga 
ggttgccaag 
aaaggcagat 
aacttcttaa 
tatttataaa 
tcaatgtttc 
agaagtaaca 
ttcttttttt 
tggctattag 
aagatgactg 
tactattaca 
atattttgaa 
ccccaaaatg 
tatatttgaa 
ggctcatgcc 
ggagttcgag 
ttagccaggt 
aattgcttga 
tccagcctgg 
ttcgaagaaa 
attttgttat 
ctcaagaaca 
ggatttaaag 
tgggaaccat 
tctttagaag 
gtgtacatac 
aaataaggaa 
ttatatatgt 
cctttatcca 
ttttaaatgt 
tgctcccagg 
gtttcactag 
aaatgtattg 
gtatttttct 
tttgattaaa 
ttttctaact 
gtaagaattc 
tcatttctta 
agtatttata 
aaagaggaga 
ataaaatata 
tgtaacagga 
tataaaatca 
tgtagtataa 
agtctttaat 
gataataaag 
ctttgtagca 
tcctattacc 
cataattcaa 
tactacatcc 
gttatgattt 
caatacaatc 
aaggagaaca 



aaacctaccc 
tgaaccttta 
atact tatct 
gatagttttt 
gctcacaatg 
aagaccagtt 
aacttacaca 
accggagcca 
aaattgtttc 
caagggacca 
attatcttat 
actggactac 
acttaaggag 
tcagtcacat 
gaagaatttt 
agtgacatag 
tatttaaaag 
tcagaagtac 
ttat tcataa 
tgtaatccca 
gcaagcctaa 
gtggtggcat 
acccaggagg 
gccacagagc 
taagaaggaa 
aaaaatacct 
tttaaataca 
gatccttgca 
tctaggtcaa 
ctgctacctt 
gttagtgcta 
acaaatttct 
tttcctatta 
catacatcct 
cattttatag 
caatgtggta 
gatagaggtg 
ccaaattgcc 
aaacttggcc 
gtgtagaagt 
tgtctcttca 
tttttaattt 
aaatataatt 
catattaaat 
aaaaatcaaa 
cttctttttg 
aaaaaatggt 
cagattggta 
attgggacat 
gaaataatat 
aatgtaatta 
tttgacaaat 
tactgataca 
atacatttaa 
agctccaagc 
tatcttgata 
tgcgtatcta 
ttaattaaaa 



tgtgttatgg 
taaaagatga 
atgttaatgt 
tctctccccc 
tctctctgca 
gttttcacag 
agaacaaaga 
aagtggagta 
acccttttga 
gaacacatta 
aaggaagaga 
cacatttttt 
gacgaatcca 
ttaatgactg 
gctgagctgt 
tattacactt 
ctaattcaaa 
agaagtcaaa 
tggactcatt 
gctctttggg 
ccaacacggg 
gtgcctgtag 
tggaggttgc 
gagactgtgt 
aattaaaagt 
gttttgcctt 
ttcagattta 
attgagttta 
tgattcagtg 
ttgttatcta 
tgtatttatt 
gttaagccca 
tggtaagaac 
gaaaattgtt 
tgtagctatg 
atgaacattc 
gaattgtata 
tgccagatat 
cttttgattt 
tataattttt 
tcccctttgc 
ctgtgactgg 
gtgtttgcca 
tatctctttc 
gtggaacaat 
atttggttct 
gtctatgaat 
aatgctataa 
tataacagat 
tagccaaatg 
aatttaaatt 
tttatgctta 
attatctgtt 
ttatccgctc 
ccaagatatt 
ttctctcata 
atatcttaac 
tatacaagta 



38820 
38880 
38940 
39000 
39060 
39120 
39180 
39240 
39300 
39360 
39420 
39480 
39540 
39600 
39660 
39720 
39780 
39840 
39900 
39960 
40020 
40080 
40140 
40200 
40260 
40320 
40380 
40440 
40500 
40560 
40620 
40680 
40740 
40800 
40860 
40920 
40980 
41040 
41100 
41160 
41220 
41280 
41340 
41400 
41460 
41520 
41580 
41640 
41700 
41760 
41820 
41880 
41940 
42000 
42060 
42120 
42180 
42240 
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agcctgggca acatagtgag accccatctc 
atgcctctag tcccagctac ttgggaggct 
ttcaaggttc taaaccagca aagctcagaa 
atcactagta ttaaactgag acacgtcacc 
atgaaatcac tgagctgaca tacctgccct 
gaagcaatgt ctatgggata gcctaacaaa 
agggtggtgg tggtaaaaat ttggagaaca 
ccctccagga aggacaaatt gctgcctgct 
cctgccgtca gacttgggct gttctctcct 
gctgacaagt aggctgtcaa tatagctggg 
ccacattgtg gaggccacat ccctgcactc 
tggggtggct ggaaaagaca gccgattgac 
ttagtataag cactgaaggc ttttaactga 
ctttgggccc attccaagaa ctctgggcat 
gttctttcca aatttctggt catctggtta 
agatttttat atcagacatc tctacctcct 
attctgttcc cttggaagat ttcctgtctc 
agcagtaatg ctttcactct gatgggaagt 
gtgttagtgc atacacagtg tctgataatc 
gaagaaggct tggagaaaag aagattcatg 
tttctctggc tcttcattct tagtctgacc 
ctatattgtg gtgactcaaa ccaggccttt 
agaatcaagt aggatctttg cccatgtatt 
caatgactgg aggaacacca gggtccttgg 
aggcctctga gcccaagcta agccatcctc 
gcctgaagta accaaagaat cacaaaagca 
tgacattcca ccattgtgat ttgttcctgc 
aattccttct cctggctcaa aacctccccc 
cctaagagaa aacccccttt gattataatt 
gccccacccc tatctccctt cgctgactcc 
tgaaataaac agccttgttg ctcacacaaa 
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ttaaaaaaaa aattagccat gcatgatggt 42300 
gaggtaggag gatcacttgc tcccaggagg 42360 
tcccagggga tagaaacaaa gacttagtgg 42420 
ctgcattgca ctttgtttct cagttctttg 42480 
cttttcacca taaagtgagt ttcatgatca 42540 
caatgtaaaa accatttagt aagttcatga 42600 
tacaaaacaa atacaattcc aaggtgtgtc 42660 
ctgtgataga agaggatcag atgtaatcaa 42720 
gggtgtggac ttgcctggtt ggtcactgct 42780 
ttgtcatgtc agctgtggtg agggggaagt 42840 
ttggccaatt tgaccatgaa tcttaagcac 42900 
atccatacag aggtcatctt" gaccacttga 42960 
gcattcacat aggacacaaa tattctgatt 4 3020 
acttttcctc cagacctcat acccagttgt 43080 
tgttattagc cactatctgt gaatcagcat 43140 
gacagaatgg aggagatatg ttacttaaca 43200 
cactgtttgt aagggctact ccctcaatgt 4 3260 
cacagtggaa ttctgggtct ccaagaatta 43320 
cccagagtgt ctggtgccct tggatcctgt 43380 
gcaagaactt gtgatgtgat gacagggcct 4344 0 
taggtgtgag aattaggtca ggggccatga 43500 
gtttactaac tgggagattt ttacattgta 43560 
ttggtcttaa gaacacaaat gatatggctc 43620 
tctcacgctg atttagataa aacgactgtc 43680 
ccctgtgacc tgcacgtata catccagatg 43740 
gtgaaaatgg cctgttcctg ccttaactga 43800 
cccatcttaa ctgagcgatt aaccttgtga 43860 
actgagcacc ttgtgacccc cgcccctgcc 43920 
ttccactacc cacccaaatc ctataaaatg 43980 
tttttcggac tcagcccgcc tgcacccagg 44040 
gcctgtttgg tggactctct tcacacggac 44100 



<210> 64 
<211> 16869 
<212> ADN 

<213> Homo sapiens 



<400> 64 

aagctttagt 

gtttctaaag 

catagttgag 

attttctgtt 

tggaatgttt 

tcagaaggtt 

aaatagactg 

caccaaacaa 

gcctgtagac 

aaagctcctg 

ttttgtagag 

gattagtcta 

cccttcttag 

agtgggagga 

tgtagattgt 

gagccgttag 

gaggttgtcg 

aagtggagtt 

tgagaggaat 



agagatctca 
ccttagtttc 
ttgggaaatg 
acttgcattc 
atgtgtagtg 
gtcctttgtc 
ctttgccaca 
tacattttag 
acatacatac 
agtcagtttc 
ttactgaagg 
aaggtctctg 
ctgttttccc 
gaaagtgcct 
aggaattatt 
tgcgatggca 
actgtggtgt 
gagctgagta 
tccaagatgt 



aaaatggttg 
agcttgctag 
tctttgagga 
tgtcatgctc 
aagctctgag 
tcagcaattt 
acattcagaa 
tacttctcaa 
tatgaatgtg 
cactataatc 
aagagttggg 
ctactcttta 
ccataagtgg 
actgacacat 
cttaaaatgc 
ttgaagaatg 
caaatgggta 
agggcagtag 
tttgataaaa 



gatggtagca 
aaaacctatg 
gacacttttt 
aggctattag 
aggactttgc 
ttaagctaat 
aatcatttat 
attgcagaac 
ctaatgtttt 
actgcagaat 
cctagtgggt 
tttgtataag 
ctgttattaa 
gatgtgagga 
tgattgtata 
agaaggacag 
gagtaggccc 
tgaggattaa 
gaatgaggag 



aattactaag 
ttgagtatta 
cactttgtat 
agcaggtaca 
attagatctc 
agtagcagaa 
ctttttattg 
tctcataggg 
ttgtattttc 
caatcttcta 
aatgtgccac 
gtgtgattat 
aacatctcat 
tcttaagtat 
gtgtggagcc 
agacaggatt 
agagattcta 
cacctactag 
gtcaggtttc 



aactctcaaa 
tggctagttc 
tcatctgtac 
tttttataac 
agcagcataa 
attgcagtgg 
cagttcttgt 
ctgggaaaat 
atagcccatc 
caaggtaagc 
taaaatgttg 
actttttgtt 
ctagagctga 
ttttttttag 
atggaagact 
tggactagta 
aaatgccttt 
aaattcatag 
ccagggccaa 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 
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agtccatgaa 
agtcttagga 
ggcagcaacc 
tggtgtgagt 
ccttaagtat 
aggggtacac 
cacaggcaaa 
agtttagcaa 
agttcactct 
agcgaggtta 
tcatgccaga 
gctatgtgac 
ttactacctc 
caatgaatag 
ttaaggccag 
tctccatgga 
ctgccaccca 
tgcaaatgcc 
tggcaagttc 
ggagcctgag 
atggctgagt 
ggtgatgcct 
atcctctcag 
tatgtgtaca 
cactggaatc 
agtagatgtt 
gtaagcctat 
gacaaacaaa 
gaggaaggac 
accagaccca 
tccaccagga 
atttcctcaa 
agtccctgtt 
atcttaccaa 
ccattatggg 
ggatggatac 
ggtataaagt 
gtcctgttgt 
ctaggagatg 
ttttggtttg 
tggggagggt 
agagaaaaga 
agccgtttaa 
cacagaggat 
tgggtacatg 
cctaatgtga 
gtgtaccact 
ggcaggaagt 
tctgtaaaaa 
caaaatactt 
atgtgtatgt 
aaacactgat 
acctattaag 
ttctgtttcc 
caagatggaa 
aagagtgcag 
cccgcctcct 
aactctccaa 



catctgatac 
aaggaattag 
attgaaggct 
tagtacttta 
actttttttt 
tggcattcct 
catctctctt 
acagttgctg 
atgaggtgga 
attaacttgt 
gcttaagcct 
gaggaccaac 
agtgggtcaa 
taggagttat 
aagcaacttg 
agggtgtgtg 
tgtttattaa 
cagtattgta 
aagaggtcac 
tgggagccac 
ggcctccctg 
aaactagtgc 
caaatgagga 
caacacagca 
tttcactaag 
ttggattcat 
gataagcaag 
ccataaatgc 
cagctattga 
tccgtagtga 
aaaaactcct 
aagtgttttt 
tcaagggaag 
gaactatacc 
tgttcagagg 
cagagtcata 
ggaacagaaa 
ggaaggatat 
tacagtaggt 
aatttgtttt 
ggcatgtaga 
ctgctgagct 
ccttactact 
ttttagggcg 
tcattataca 
actctggtct 
ctagtggtgg 
atatgggaaa 
ataaagtcta 
tatgaacaaa 
ataattttca 
acattagact 
gttcattcat 
cccagggagt 
agccctacta 
cactgacgtg 
atatcatagg 
tattatgtaa 



ctcagtgaga 
aacatagacc 
atttggtgtt 
tacttgaccc 
aagcccacaa 
cagcagggct 
atttttccaa 
tgtatcagtg 
tactactatc 
ccaagatcac 
agagcatagt 
ctctctaatg 
atgaaatcat 
cacatcttcg 
ttgagctacg 
ggacctgtta 
atgataagga 
gtggctatca 
tgccagccac 
tggggatcac 
gagcatggca 
tgttctcgtg 
gactactcag 
catattaata 
acattgtttt 
attcattcag 
tattctcatt 
aaactattta 
tgggtaggaa 
tccagatgaa 
ggcctatcag 
atggttgagg 
cagcaatgaa 
cacttaagga 
agagattatt 
gggaggattt 
tgaatgagac 
aaaactcaac 
tgaggtaaac 
ggtttgaatt 
atgcattctt 
gatgtaggag 
gcttcatgac 
gtgaaactat 
tttgcccaac 
ttgatgatgc 
gaggggttat 
tctctctact 
ttttttaaaa 
tcttttctcc 
ttcaaacgtg 
atctcgaaca 
agctgtgatg 
atattaccaa 
tgctcaaatc 
gctcattcct 
taagtttgac 
aagagtgtgt 



gaagtgacag 
cccaaggctc 
tcgggatctg 
aggtggact g 
tctatatagt 
gggaaaaacc 
catttaatac 
gctgagcat t 
cccattttct 
atagccaaca 
tcctggctct 
tctcatctgt 
atgtgttaag 
tatttgtgca 
ggtttagtgt 
ttgtgactgt 
caataatgca 
cagcagtgcc 
tgagctagag 
ggccaagagt 
gtggcagaac 
tggacccctt 
atcagtgact 
aatacctact 
tactttgcat 
catacatt tg 
tagaatttgg 
tatgataaat 
ctagcaagta 
acagccaccc 
gtgctatgtt 
tacacattcc 
ttacactgtt 
ggtgctggat 
tccagctcaa 
aacacaggac 
acaaagcctt 
tgggagtgga 
atatcctgaa 
catggtatct 
accaaatcag 
ctttggctgc 
tgtggctaac 
taatactctc 
cccacagaat 
tatgtcagtg 
tgataatagg 
tctgctcaat 
agtggggatg 
agatgtaaac 
aaacaacttt 
ccttttactg 
ttctattttt 
attggtgatg 
agaggtttta 
accctctcta 
aaatggcaca 
tagtcagctt 



attgttgtgt 
ggcaggcctg 
aactgtcatt 
agaaactcaa 
cgaagtctgt 
aacaacaaaa 
attgttaata 
t tgcatgctt 
agatgagaac 
agtcatggag 
acagctttag 
aaaataggaa 
cact tagcag 
ttaccttcac 
actaacagtt 
ctgtactttc 
acaaagtagt 
actggcaggc 
cccagatcag 
gtgaccaccc 
aactccatga 
ttctctacca 
tagtcctgtt 
atgtgccagg 
ttctgccttt 
aatatgctgt 
gaatattgat 
aactttggac 
gcggactgtg 
tcagacactt 
acagttcagt 
tacagcttta 
cccgtagtca 
gtcataaaga 
gacccaggga 
atgtacacat 
gaatgccaga 
agagaaaggc 
gactataatc 
attttctttg 
catgattttc 
agtctctatg 
aaagtaggga 
tttgtatgat 
acacagcacc 
tacgttcatc 
ggaggatgtg 
tttgctgtaa 
gtattacggc 
tgtcatatat 
agaattggca 
accactttga 
attttcaatg 
ttgtttctgt 
tccaggacca 
gccccagaga 
ggtttttttt 
gggctgtcag 



ttaaaccaca 
gcacggcaca 
taggggacag 
gtgatgatgc 
tcctcccaac 
aaagtctgca 
aaatatctaa 
tatttcattc 
at tgaggcac 
tgaggcagrc 
caagtgacrg 
ttgtaaatag 
agtaagcact 
agtttacaca 
tccatgtgtg 
gtattgttg- 
caagtaatgt 
agcaccatgg 
gcatgcaaga 
aagacccaga 
actcagat cz 
gaaaccttga 
tggtgttata 
cactgcctac 
acactatgaa 
gttatgcata 
tatacatgtg 
tgatggctgg 
gcctgcatag 
ggataaaggg 
tactggaagt 
cctgctgcca 
aggacagtat 
tttggatcaa 
agaggacara 
tagttagttg 
aatactagta 
agcagtgagt 
caaagattat 
agtggatggr 
aagacagtac 
gctttcagca 
tagtacggag 
actataatgg 
aagagtgaac 
cgtgtaacaa 
catgtgtggg 
acctaaaacc 
aatataaaai 
gcaccctcgt 
ccaaacatat 
aaacttgctt 
tgggattatc 
gattgatgaa 
gtattgcgag 
ccaatt tgat 
taacttagtt 
gacaaaatat 



1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
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cacagactga gtggcttaaa caacagaaag 
ccaacatcaa ggtgctggca acacggattt 
tggtcacctt cttgctgtgt cctcacatgg 
tcttcttata aggacaccat ttctgtcaga 
ccttaattgc ctccctaaag gtctcatctc 
caacatataa atttggaggg tggcgggggg 
atgagtatta ttaagtacaa aaaaattaga 
gtagctggag tgtgagtgct atcagttatt 
agtggtatgg ataagatttt tttggagtga 
ttgctcagga actaggttat ttaggttact 
aggaaagaac tatcccagtt atcccatact 
gctacacatg tcatcttagg cctttatagt 
tgtgcttttg ttaatttcaa agctgccaaa 
ctgattaata caatttttaa agttttcaga 
tctgcagtga gcatgcatca ttacttttgc 
gagagaactc cagggacaaa taatatacca 
tacattacca aacaattcta gccttctgct 
tctatggatc aggatctcag cagaggcagt 
tactgcctcc tctttctaat ccccagattc 
gcatggcatg aggtcagaac accagttctg 
atttaccggc catgtgactt tggcaagttt 
tgtaaaatgg gaataataat agtgcctacc 
tgatacatgt aaacttagag cagtgtgggt 
actgtttttg ggagaatgcc atattcttta 
taatttcaaa gtaatgcatg tttcaagggc 
cccagtgtct agaaatttta acatcttatg 
aacctttccc ttggctgcct tccagggcca 
ttggaatttg tttgtcatgc accttctgag 
acagttccca ccagaccaga gaagggctac 
ataacaatta aggaatcagt tgccaaccat 
aggcctggtg tggtggctca cgcctgtagc 
gggcaatgga gtcagattct ctttcttaaa 
ctaatattct tagtaccaca agatatgtca 
aaaagtgact aaaaagtttt tctcctgcta 
tggtcactta gaaaattaaa agggataggg 
agcactttta gaggccgagg caggcggatc 
tcaggagttc gagaccagcc tggccaacat 
aaattagcca ggtgtggtgg catgrgcctg 
gagaatcgcc taaacccagg aggtggaggt 
ccagcctggg caacagagtg agactcttgt 
ggcacagtgg ctcacgcctt taatcccagc 
tgaggttggg agttcgagac cagcctggcc 
tacaaaaatt agccaggtgt ggtggcgcac 
ggcaggagaa ttggttgaac ccaggaggcg 
gcactccagc ctgggtggac agagcaagac 
aagggataga atataatgaa atatattttg 
cctaggcaaa agctgtaatt tccagagaga 
ccattattta tttctagaaa ctcataaaat 
taattaaggt atagatgact gaccaagggc 
tcataaagcc acacaagcct tatgttctca 
gctttaacca taagaaaaat gattggtgga 
ttcatctagg ccacgtgcgg tggctcatgc 
tggatggatc acttgaggtc aggagttcag 
tctctactaa atatacaaaa attagttggg 
ctcgggaggc tgaggcagga gaattgcttg 
agatcgtgcc actgcactcc agcctgggtg 
aaagaaaaaa ttttaattta atccttctgt 
tcttaataaa gctgctcttt actgtttcta 
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tcactttctc acagrtgtgg aggctgaagt 4680 
ctggggaggc tttrcttcct ggcatataga 4740 
cctttcatgg agrgagagct ctttggtgra 4800 
tgagggcccc acccttacgg tttcattraa 4860 
caagtaccat cacattgggg attagggctt 4920 
ggatgcaatt cagtccataa caaaaaaagc 4 980 
gagctttata gaaaatatga ggcattttat 5040 
ttgagttaga gcaatgtgca tctactaaga 5100 
cccagggtta aactgtacta caagaatgta 5160 
tatttataca aacctattca aaaataattt 5220 
tgcaaattct caaratgtgt gcctctgcat 5280 
ataaaggctg atagttgaaa tggcagctgc 5340 
acagttgtga gatagactca caagaattta 5400 
tttttacagt tacttcagac tttttatctt 5460 
atcctgagaa caagcataag tgtgtttttg 5520 
ctgttattct cacctatatg tcaagtttga 5580 
tataagtata tagaattttt atttacctta 5640 
gatgtatcag aarcaccttc gggattcctc 5700 
tgatatgcat ccttgtccta cagcgaggca 5760 
gagccagact gtctaggttc acagcctgcc 5820 
cttagtctct cttgcctcac tttcctcata 5880 
tcagaaggtt gatgtgagga atgaaggtat 5940 
acaaaataaa catgatgcaa gtgttcaanc 6000 
agccgttaaa gaagaaaaaa tgattaagaa 6060 
taatgccagg ttgctcccag agtggtctct 6120 
aaaatgatat atarggtcaa aaatgtattt 6180 
gaggaagatc ttccaaggaa gatggaatac 6240 
tatttcaagt cacggtcatc accatttccc 6300 
atatggactc atgttgggcc tactcctgca 6360 
ttgtagttca caaattaaaa ctgggtttcc 6420 
cccagctatt gcaccactgc tctccaagct 6480 
aaaccacaaa aaaactggat ttccagttct 6540 
taggtatctt taaatgaaat tcttagctgg 6600 
cctagtaata aacaaatcat tgtttattac 6660 
ccaggcacag tggcttatgc ctgtaattgc 6720 
acctgaggtc gggaagtgga tcgcctgagg 6780 
ggcgaaaccc cgtcgctact aaaaatacaa 6840 
taatcccagc tatttgggag gctgaggcag 6900 
tgtagtgagc caagattgca ccgctgtgct 6960 
ctcggaaaaa aaaaaaaaaa aaaaaggctg 7020 
actttgggag gctgaggcag atggatcgcc 7080 
agcatggtga aaccctgtct ctactaaaaa 7140 
acctgtagtc ccagctactc gggaggctga 7200 
gaggttgcag tgagcagaga tcgtgccact 7260 
tccgtctcaa agaaacaaac aaaaaattaa 7320 
aacttaaatt atattctata tgtgtatctt 7380 
ccattaggaa caggtagtat ctatttttct 74 40 
ggattgtatt tttctataag aacaaaatat 7500 
ttaatcaaat aaaatgacta acagcatcta 7560 
tctcaaaaat gctgtgacag ctttttggct 7620 
tgattttatt agcccaggct tttaaaaact 7680 
ctgtaatccc ggcactttgg gaggcctgag 7740 
gaccagcctg gccaacatga tgaaaccctg 7800 
tgttatggtg catgcctgta atcccagcta 7860 
aactcgggag gtggagattg cagtaagccg 7920 
atagagcaag actgtctcaa aaaagaaaaa 7980 
agaaacaggc attcagaacc attccattga 8040 
gtcaaaaatg agacttcgat caaaccataa 8100 
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gattttatac tgcagatagt cagcttcacc 
gcttcctgct tgatagtctc ttgactacca 
cattggtagg ccattagcat tgatatcttt 
acccataata agaggcctgt tgtatatgaa 
cggttaagta agggagcaac acgtaaaatg 
ctcttttgtc ctgatttaac cagcattttt 
tgattgtaat gattttgagc tgcagcagct 
ggtgtttgag ttggaaagaa acaactatag 
tcacaaaggg tatagtaaaa ttgattgtaa 
tttggattaa aatgtatttt tcaccgtgca 
caatttaaat ggggctcttt aaccaaaaat 
agaatttgga gtagaggccg ggcacagtgg 
gctgaggcag gcggatcacc tgaggtcagg 
cccgtctcta ctaaaaatac aaaaattagc 
gctagtctac tcgggaggct gaggcaggag 
agtgagccga gatcgcgcca ctgcactcca 
aaaaaaaaaa aaaagatttt ggagtagatt 
atcaaaaaat ggctaataaa atgaacacaa 
aaaaatctat aaattgatca tctgtttata 
aaataaagat tgaatttcac ccagtgtgat 
ggccggacct gatatggccc tggtctgtgt 
atctttcccc tgtatgcccg cccaattttt 
ctccaattct accttccaaa ggcctttctt 
tccagattcc catgcctttt tggaatcaat 
ctacttccat catcctcact cctatccctt 
tatttactca tctttgtaac ttccacataa 
ctgattgtag ggtctgagtt agatactgtt 
taattcatat taactttggc tgaaactttt 
tagattgtta cattctgggt tagtattaga 
ttttaagatg agttttaaat agttctctta 
aggaaattat cccaaaccat tccagttcct 
gttttccact tcagccgtaa gtaggtgaaa 
tttgctttat acacatgcat gtgtgttgtg 
tgaagtttct gtcatgccca gaaaagggag 
ctggggatgt ttgaagaact gtgctgttta 
ggtaggaggg tatacctcct acacccaaga 
agaaggaacc caaatgaccc acaagaggtg 
tgcacagtaa tttatttaag cacctcttaa 
agcggaaagg ttcacaataa ataagagaaa 
ttctgcaaac aagaagcatc ttttataaaa 
gcctgtaatc ccagcacttt aagaggctga 
atgattgtgc caccactcca gcctgggtga 
aaaaaaaaaa aaagacggaa attcctccag 
agctactttt ttcagcttta tacttcgcag 
ttttccaaat tttttacaat aagcacacac 
aactggtggt gaacaaccgc tggcttttag 
gtagttctta aacccttgaa agggagtgaa 
tcattatttt cctatattca catcatgatt 
agcttcagcc actcctgggc caggcgcatg 
ttctgcaggg tgcctgtatc atctgaattg 
ggttcaagtt tttctttcct gtcctccact 
cgctgctgac ttaaggcccc aacaccaaac 
agcaagctcc aacaattgtg taaggtaaag 
tcctagtggt tctgtttctc tgatcgaatt 
agagaaggca aggaactact gtttctcatt 
tttgctatga atatgtagtg ctttgataca 
cacataggga aagatagatt ggattatttt 
gaataaaatg ggagaaacag ctccctcatg 
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aaagccgcag aggaaacatg tcgagatcag 8160 
ttaaaacgaa tattgggagg tcatgaaagt 8220 
aaaacatcta ccctaaacca tctgctatgg 8280 
attgtctaga attcaggtgc aggtctttgc 8340 
ggagaggagt ggggtgtact cacttgcctc 8400 
caaccctggg aaaatttgca gaatctaagt 84 60 
ttaactctta ccctttttcc acatagttat 8520 
gtagctacac gtacataatt atctctttat 8580 
ataactttct aagtgccaat attcaaaact 8640 
tttactttgg atgtatttat ttcatttaaa 8700 
ggtatttaaa accaaaacag tatcgtactt 8760 
ctcacgcctg taatcccagc actttggaag 8820 
agttcgagac cagcctggtc aacatgaaac 8880 
tgggcgtggt ggcgtgcgcc tataatccca 8940 
aatcgctgga actcaggagg cagagactgc 9000 
gtctgggtga cggcatgact ccatctccaa 9060 
catcattaat aagtaacaga ttttaggaaa 9120 
tgtaaaacat ttattaaaat gtagactttt 9180 
aattggcaga tggttgtgta ccatctttta 9240 
ggttcccatt gcttatattt ctcctgctga 9300 
tcccagcctt gtttcctcat taccactaaa 9360 
ctggctctga gtccttgttc atactgttct 9420 
aacaccttcg gattctttct ttgagaactt 9480 
ctctatccta ttgtcatcac atttaagttt 9540 
tggtcctggg atgacaggga tgctgtgttt 9600 
cctaaccccg gttcttgctt atgggagatg 9660 
aactaaaatg cttgttgata ttttagttat 9720 
aaattctatt gtgaatagtc aagtaaaatt 9780 
ttgtttttaa gattgtttta aacaagatgt 9840 
acacaaataa agcttaatat gagtatttga 9900 
ggctgtgaaa ggcttttcca ggcctaataa 9960 
tcaaatgaac aatagaggga aatgtattta 10020 
tctacatata aacattgcac acgcttagaa 10080 
aggcattttt gtggattttg tctggctgcc 10140 
cttcatacca ggtgtgtgag ccataccttt 10200 
aatataagcc aggagaaggt ctgtgccaag 10260 
ggccattaat tattgggtca gatgcataaa 10320 
tggtgaccca caaggaagat tgctcgtagt 10380 
aaagcagaat gtagaactgt atgatagcaa 10440 
gatggaagga gcccaggcac agtagctcat 10500 
ggtggaggat cacttgagct gcagtgaccc 10560 
tagaagtgag accttctctc aaaaaaaaaa 10620 
aattttaaca tgtcaacaga ggttttctgc 10680 
tattttccaa attttctcta acaagcagta 10740 
acacacacac gtttgtttgc ataagtgccc 10800 
tctatacata tctagaatat tttataaata 10860 
tgaccagctg agaaaataaa gtcagtgatt 10920 
ctaggaaaga actt'g<3gagt gacttccttc 10980 
cttagctctg tggtaaaggt caccagcttc 11040 
gaggtttggc gagggtaaga gactgatgta 11100 
tgaaatctgt cttcccttcc agactgcctg 11160 
acagaagcaa cagccttaca cagagtgttc 11220 
tttcctttat agattccttt tctatatcgc 11280 
ctggctgata acagttgctg agactctgaa 11340 
ataaactgtt tagaattatt tggccatctt 11400 
ttttttaaat caaaaagtaa tgaaagagat 11460 
taaagtttat atactaaatt gaaaagcaaa 11520 
tggctgttgg caggaagctt ccattcctct 11580 
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ctgtgggcct ccacaggttt gctcacagca 
gttgcaccca agatggaagc caccatcttt 
ccagcacttc tgccatatgc tgttgggtca 
aggaccacac aagggcgtga attccaaggg 
cagagggaca ccctatccag ctggtggcca 
aatatgtatc tataatctta aaagtattaa 
taagaatcca tgctaagagg atttaaaatg 
gttaacagta tttaaagttg tgaaaaacca 
atgaattttg atatttttct aatagaattt 
taatttttaa taacgcaaaa aaaagtttat 
tacataatga ttctgatttt gtaaaaaaaa 
tacatatgca tataaagaaa actggaacaa 
tcattttaat attctttatg cttttaaaaa 
cttacgtagt caggaaaaaa atacaacttt 
tctaaatggt gttacaggct gaatgtgtgc 
aagccctggc ccccaaggca atggtattag 
ttctacgagg tcatgagggt ggagcccgca 
agaacagacc aaagccttcc tttctctcct 
cacagccagg aagagagctc tcaccagaac 
ctcagcatcc agaactgtga gaaatgaatg 
ttttgttgca gcagcccaag ctgacagaga 
gaatggatga tcaaaacgtg gtgaggtcgt 
atgaaattct gatacatgct ataatgatga 
aaacttaaaa ggacaaatat tgtataattc 
caaattatgt catagataca gaacattaga 
gtgggtacaa attttcggtt tggagtgatt 
gtagtcaaca tgatgaatgt acttaatgac 
ctgggctggc gcagtggctc atggctgtaa 
ggatcatgag gtcaggagat tgagaccatt 
taaaaaataa aaacaaataa aaaaaaaatt 
ccagctactc gggaggctga ggcaggagaa 
gagctgagat cgcgccactg cactccagcc 
aaaaaaaaaa aaaggttgat acctgggtgc 
gggaggccaa ggcaggcaga tcagttgagg 
ggcgaaaccc catctctatt aaaaatacaa 
tagtcccagc tgctgggagg atgaggccta 
gcagtgagtt gagattgcgc cactgcactc 
caaaaaaaag gttaaaattg taagttttgt 
tagatatata ggagataaag tcaacagaat 
gaggaggatg aattaaggaa gacattgagt 
aaaaatacgt gggcaaagat cctacttgat 
aacaaggcta ggtggagatt tgcatgtgat 
ggactgtgag ccatctcctg gacttgaata 
gaactcagga gacgtgcaat gcagtaacaa 
aatttaatgc ttttatggga caaactgtta 
ttgtgggttt ctggcctgtg ggccagcctc 
agaacacatt caggcctacc acagtcaagg 
aatatccgaa gcctagaaat aataatcatc 
ggaaagggcc ttgggaatta agaagaatgg 
cttgcagggg aatcactgaa atggggacag 
cagcaaaggc atcgtttttc agagcaagct 
cccctgggca cagaggttag gcaagggagt 
aataatgcca tagaggagct tccaaagagt 
taggcaaata aaatttgatt ttgtgaataa 
tcatagattg atagtggctt gtgatccaga 
tctttgtaga tgtacggatt tagagaccat 
aaaaatgagg cctaaagaag ttaagaaaat 
acgtaggatc cgaaagaaat tgggtaaatg 
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aatggtccgt gacagaaaga cgcaagggca 11640 
tctataacct aatctgaaag aagggacata 11700 
cacagaccaa ctctggtaca gtgtgaacac 11760 
cagagaccac tagggaccac ctcagaggca 11820 
atgtaaatta acatagcttt ttagaatagc 11880 
aagtacttct tgatccagta atttcatttc 11940 
tggaccaaaa aatgggtata aaaagaagtt 12000 
gaaacaatct aaaggtccaa caataggaaa 12060 
tatgctgtca tcagaaatac catttacaaa 12120 
aaaatgttta gtgtaaaacc tggacacaac 12180 
aaaacaaaaa cacacacata tacacatgca 12240 
acaaaataac aagcatagtt ggaattacag 12300 
ttttgaagtt tgtattacta gcatccacta 12360 
aaaatagata tttaggtcca aagatggtaa 12420 
ctgatcccca tgccccaagt tcatatgtta 12480 
gggagtaggg cctttgggag gtaatcagat 12540 
tagtggaatt agtgtccttt taggaagagg 12600 
cactatgtaa gaagacagcc agaaggtggc 12660 
ccaaatctgc tagcaccttg ctcttgggtt 12720 
tgtgttgttt aaaccactca ggctacggta 12780 
tagaaacaac acaaggaccc atcagcagac 12840 
gcagtgggat attattcagc cgtagaagga 12900 
accttgaaaa catgttaatg gaaataagcc 12960 
cacttatatg agttagttac ctagaatagg 13020 
ggttaccagg gttgtgggaa gaggggtatt 13080 
ttgaaaaaat tctggaaatg ggtagtgaca 13140 
actaaattgt acacttaaaa atggttaata 13200 
atcccagaac tttgggaggc caagacaggc 13260 
ctggctaaca tggtgaaacc ctgtctctac 13320 
agccgggcat ggtggcaggc acctgtagtc 13380 
tggtgtgacc tgggagtcgg agcttgcagt 13440 
tgggcaacag agccagattc cgtctcaaaa 13500 
ggtggctcat gcctgtaatt tcagcacttt 13560 
tcaagagtta aggaccagcc tggccaacgt 13620 
aaattagtcg agtgtggtgg tgggtgcctg 13680 
ggaattgctt gaacccagga ggcagaggtt 13740 
cagcctgggg gacagagcga gacttagtct 13800 
tatgcatatt ttaccataat ctttaaaaaa 13860 
ttaataacca gttgtaaata gagactgagt 13920 
acaacttttt ggtaggtgaa aaactcttaa 13980 
tcttataatt taaaaatctc ccagttagta 14040 
gtgaggtgtg tgttctgttt tgtaatgtga 14100 
tccattagat aattgaaaat acggatttga 14160 
aactctgcac ctagttgatt tctgtctcct 14220 
ggcaggtggg caagatggac agccatattt 14280 
agtgctcact ctgaggtcat gtccaaactt 14340 
ctccctttct caactctagt cctctgcaca 14400 
tgtccttgtg tcttgcatta tgaaagccta 14460 
aaaaactggt ctaactgctg catgcttcag 14520 
gccataaaag gacaaccaga agagtggctt 14580 
agagaatcct gccagcgtcc tcaggcaggg 14 640 
gtcccagcat gttgatgccc tgagcatcag 14700 
tcatttcagg ttttgtaagc cgaacatttc 14760 
agcttgtttc ttcaactcca gtgcagattc 14820 
taaagaaaac aatttttcaa agattcatat 14880 
ctaatctaac tccctcattc tacagatagg 14940 
accatggaaa tgtcactgct gaactgccat 15000 
ctactgtgag aaatacagta ctaggtccaa 15060 



WO 99/67395 



PCT/FR99/01513 



agaatctaat acaaattaaa aatctaaatg 
aacttacata gtttcatttt ctttctttte 
gtggctcatg cctgtaatcc tggcactttg 
caggagtttg agaccagcct ggccaacatg 
aattagctgg ctgtggtggc cgctgcctgt 
agaattactt gaatctggga ggtggaggtt 
tagcctggat gacaagaggg aaactccatc 
aacctgtgtt gtttattaaa catgacagac 
aaaaagctac aatctgccag gcatggtggc 
caggttgggg gatcacctga ggcctggagt 
ctcgtctcta ctaaaaatac aaaaattagc 
gttactcagg aggctgaggc aggagaatca 
gagccaagat cgcaccgttg tactccagtc 
aaaaagaaaa aagaaaagct acaaccttaa 
ctgattagaa gagtggaagt ggggaggttt 
ttctccccat gaatagtgaa ggtgtgagtg 
aacaggttct tgcactgtca cccgggctgg 
gcctccacct cccaggctca agtgatcctc 
cagttgtgca ctaccatgcc cagctatttt 
ttaggctagt tctcaaactc ctggcctcaa 
ttgtgattac aggcataagc caccacaccc 
tgctgttggg gaaatataat ttaaaaaaca 
atgaaggcag tagagaaaga taagctttat 
gcacatcaca ggcactttgc taagagatca 
acagccaagc aggtacagcc cattacatgt 
gagaacttga cagcaccact ggtcacacag 
gaccacttgt gttatctaag atatcaactt 
ttacttttat agcttggtgc aaggtactca 
actggaagat aggtatgcta tctggtaatg 
ttcctaggtc ataaagctga caaaaggctg 
tgtatttca 
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ttatttctaa agcatccctg cacatggctg 15120 
tgttgaagaa gaggcaattg gctgggtgca 15180 
agaggccgag gcgggtggat cacctgaggt 15240 
gtgaaacccc atctctacta aaaatacaaa 15300 
aancccagct actccagagg ctgaggcagg 15360 
gcagtgagcc aagaccacgc cattgcactc 15420 
tcaaaaaaaa aaagaaaaaa agcaatcact 15480 
tggcatgaag taattaccaa actgtaaaca 15540 
tcatgcctgt aatcccccac cttgggaggc 15600 
tcaagactag cctggtcaac atggtgaaac 15660 
ccggcgtggt ggcacatccc tgtaatccca 15720 
cttgaacctg ggcagtgggg aggttgcagt 15780 
tgggccgaca gagtgagact cggtctcaaa 15840 
tctcaacttc tcataacatc atctctactt 15900 
attacaaaaa gactgttata ccttacacac 15960 
aaaaagacag caattttatt ttttttttga 16020 
agtgcactgt tgtgatcact gctcactgca 16080 
ctacctcagc ctcctgagta gctgggacca 16140 
tttttaagag atggggtctc actatattgc 16200 
gcagtcctcc gaccttggcc tcccaaaggg 16260 
agccagcagt tttagaataa agggtgaagg 16320 
aaarcttctc tcaacccaga aatcctctcc 16380 
tattgaataa aaattaaatg agaatgtgat 16440 
caaagacaga aggaaatttc accattttgt 16500 
atgttttcga gataaatagt cctcaactaa 16560 
ttcattctaa ctttacctga taattgatgt 16620 
ttcgggggtg ggggagtgtg gaaacaggag 16680 
ttaagattag gctgttaccc tcccacagaa 16740 
tttacatttc ccagatcctt gagaaagaca 16800 
attcagtttt taaatatata tatctgtata 16860 

16869 



<210> 65 
<211> 15000 
<212> ADN 

<213> Homo sapiens 
<400> 65 

gatctcttga tcccaggagg tcaaggctgc aatgagctaa gatcaagcca ctgcattcca 60 

gcctgagtga tagtgggaga ccttgtcttt aaaacacaca cacacacaca cacacacacg 120 

agggcctttg accactcttg agtagaagac tcgagaagaa caaagtagaa ggccagagaa 180 

gaacaaagtt acttgaaaga tctcttatta aagagaatgt acaagctatg aaaaaaaaaa 240 

aacacacaca cacacacaaa cctcatctgg aatgaaaaaa acataatgca tttggtttct 300 

ggttccttag gctgttatgg aacaaccaaa gaacattatt ttggtttctg aggtcagaac 360 

tattttattc ccctcaagca cactatgctt atggtttgag ggagaatgag aaataggaaa 420 

ctaggaacag gctgaaatgg tctaatcttg accatctaat tctgcagtgt cttattctca 480 

ttctaaaaga gaatggttat attcgctgtt ctagcataaa aagtaatgat aaaaataaaa 54 0 

gatcccgtat taccagacaa taatccccta gactgtttta atgcttggtt gagtatttgc 600 

ttatgatctc agactttaaa agatggtctc cccctatggt gaagcttgtt aattatgtag 660 

gcatcattaa tgtctgttta cttatcaaaa ttttatcatt gttagttgta ttactacttg 720 

acagtccaat ttatttaatt gaaaagattg gttaacattt tatagtcaaa gtaattgttt 780 

cctgtgtttt ttcctgttta ggttattgga gtgatgagta aagaatacat accaaagggc 840 

acacgttttg gacccctaat aggtgaaatc tacaccaatg acacagttcc taagaacgcc 900 

aacaggaaat atttttggag ggtaagtaag ggaaatttct tcagacccat taaatgttag 960 

gaaaaaatgg agctaaaaga gctgggtggc tcacctttct catcctgtgc tgagaaatgc 1020 

tggggctcac ccataagtat ccagcatccc catggacaca gggaattctg aacaaatgtg 1080 

atgaaaccga tgaaatgtct ggcctgtagg tggttagtga tggagatacg ggctatatgt 1140 



WO 99/67395 



PCT/FR99/01513 



55 

gaatcttgat ttttgcaatt cattagagct ttgtaatgaa aggaaacagt ttgttgcttg 12C0 
ctttaaggat aggttcattt gcatttctcc gcaaggaagt agtaatgact taccaagcc: 1260 
tagatttcac ccctttttga tttcttgctg acttaacttt aattgaatcg aagagttatc 1320 
acaaatgaat tatctttttg gttttttttt ttttgagatg gagtctcaci ctgtcaccag I3c0 
gctggagtgc aatggcatga tctcggctca ctgcaacctc cgcctcccag gttcaagcaa 1440 
ttgtcctgcc tcagcctccc gagtagctgg gactaaggtg cgcgccacca tgcccagtta 1500 
attttugtat ttttagtaga gacggggttc cactatgttg gccatgatgg tctcgatctc 1560 
tggacctcgt gatccgccca ccttggcctc ccaaagtgct ggaattacag gcaagagcca 1620 
ccgcgcccag ccaggaatga caaatgaatt accttataag taaatgccat taaggaagga 1680 
tagctggaag atgggttgag gggaatggag gaccacagaa ctagtcctar ttaaatacat 1740 
gtgcatggta aaatgattcc atttgacaat aggttaatta ictcatagca taaggaaaai 1300 
gcttaacagt catatgcaag atgataagct ttcctatagc atccaaccaa aagatctagc 1860 
cagtacaatt tcctttgcta tattagggtt agaaaggccc ccagaggtga accaattaga 1920 
tggaatcctt gaataaaaca ctggattagc agtgaacaga aaaaagtcag attgctttcc 19S0 
ttcttcccat agatgtctca gggatattta gtttcctcag aagataaaga atttagtaag 2040 
cgtttttttg tgcatactta catgaaatgt acattatttg aattctttaa aaagaaacag 2100 
ctgcatgata acaaaaattg tgttatgctt gctttagctg gtatttttgc ctagaacgat 2160 
tatatcgttc ggacaagaag ctattcctaa gaaacaatat ttttaatcca ggaagttttt 2220 
catttttaga aatttatctt actatttccc aagcaaaaga gggtagttac agattcacta 2280 
agaatcatgt gctcacaatt tttatttaat aattattcct ccttaaaara tattaatcac 2340 
ctgacttaca atggtggaac catgagtgca tttttgcctt tattgtcaat aacgtcttct 2400 
cagaagtgag ccacaaaggt gcatagttct tggagttaaa ggtctgaatt aagacaatcc 24 60 
agcataagtc tcattaatgt gtgattattt tgagaaaagg caagaagtac ctaagaatct 2520 
ccccctcact gtccagttcc ctgtttcatt taaagattca ctgtaagtaa ctgaaaggct 2530 
ttccttggga ggatttattt gaatcagtct ttcacatgca aaggatattg tagaacatct 2640 
cgtttttgct ggcaggaata tgaacatctg ttgtgaggaa agaaaaagtr tcatgcaaat 2700 
tacactgcca aagaagggat gttcaagttg agaaaccagt gacatttcct gtaactgtac 2760 
tatgaaccag cgcattttaa tcttctagat aatatatgga agtgcaggaa ggtggtagga 2820 
aacggtgttc attttacata tgcgttattt tattctgtgt gagtgacttc atggcaccga 2880 
cattgctgtt tttaaatgag gatacagtaa attgcagtcc gaggaaggct aactggaatc 2940 
aacatacccg tagctttaga aagcagtttc cgcaccagcg aagagtacaa gagcgatgga 3000 
accccatgtt cctggaagtt tgcacatcag agtaaacaaa cttgaaaacc cctcttgata 3060 
gcagaattca cccagccttg ttccattttc tcttaacaaa acacaccgca aaagctctca 3120 
caagctgctt tgatgaagcc acatgtattt cccccttcac aatttacagg aagttactct 3180 
taaaagaaag tgattctggt gtttaccgcc tgtgttaaag ggacagagt* cctttttatt 3240 
tctgataacg tttgagcgaa atacagaaac tatctgtaga ctagcatagt cggtacgtga 3300 
gtaaggaaaa gcaataacct gctgtccggt gagcacaaaa ttcctgctac gaacagtgcc 3360 
ttactgctgc ttggagactg caagtcgcag atcacactag gtattgactg attgtataag 3420 
gaaatttctt aaagtctaaa gtaaaggtgg tacctcctaa aaagagggga agagagaaaa 34 80 
ctttgtgtgg aaggataagg agtgtgttta tagtttcagt aagagtgtac gttttaattt 3540 
ttcttcttcc tctgcctctt tgccaagtag cctgagtgca tctgttatcc agaagtagta 3600 
ttactctagg acaaacttca aattcttcat tctgcgttgc ctttaaggaa caacatactt 3660 
tcttcctgtt ctttttccaa aaacacacgc ctatggctct gtgtgtggtg ttttagccag 3720 
cctcctccca gataaggggt tcccttccct cctttgcatt gaaaggaaag tgcaagtctg 3780 
gacatgttta tcaagaggaa aagtgacttc tcagtaatag actgtcaaat tcgggctgct 3840 
gcccgagtgt tcgctttgtt atggcaggtg aagttcacct ttgccccacc cagtgtttcc 3900 
acaaaaaggc aaggttccaa gtattcatat gaacaagtgt tactttagga cttggagggt 3960 
tgggggtgga ggatgtttgc atagttgaag ccttgggcgg gggtgtagga aacggcgagt 4020 
acagaggcca tagaaaaagc taagactcag tttgacgtcg tcagccggct tggtcttcta 4080 
cccagtgact caaagcacta aaagtcagca taatcggaac tgaagtcagt agcatcgccc 4140 
atttgccatt cactgcagta gcaaaagtag tactctgtgg tgggttaatc ggtttgaggc 4200 
agctccttaa atgaacattt gtgtttcatt tttctgttat tttcccgaac atgaaaagac 4260 
gataaaactg aaatggaaaa ggtaactgac aaaagtgtgc cttacctgtt tccgccctga 4320 
tttctgctga ttcaagacta ttctggctaa actgattgga ttctttttct aactaggcag 4380 
taggggatca gaaatcacac acggtaccgg ctgtgtttat tctgagaggr gctggggagc 4440 
tttgggtctg acttcctttt acatgcctgt cttctctttt ggacagatct attccagagg 4500 
ggagcttcac cacttcattg acggctttaa tgaagagaaa agcaactgga tgcgctatgt 4560 
gaatccagca cactctcccc gggagcaaaa cctggctgcg tgtcagaacg ggatgaacat 4620 
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ctacttctac accattaagc ccatccctgc caaccaggaa cttcttgtgt ggnattgtcg 4680 
ggactt-gca gaaaggcttc actaccctta tcccggagag ctgacaatga tgaatcicag 4740 
taagtggatt acagaacaaa aaaataaaaa atgccagtaa tgtcggtter gcccczzzga 4300 
actaataaca tgttgtttaa ttatacggct ttgtcatgtg ttggatgaag taggtgget" 4S60 
aagctaggga ctaggaagag gaaaaacatt ttttgagtcc ctattaacta ttaggaaacr 4920 
tgatcattta aaagtatata tatatatgag gagctacctt gagtttrgaa ttcaggatg- 4980 
tacaggaaga aatatatgtc caattctaat rtatccaaaa gcaguiggga gaattacagg 5040 
gattggrcca gacatgctgc gtatgcaagg tatagccctc atctgtggta ctttggcagg 5100 
gcttagactg catcaaaata tttatagatg tacatttgag tgtacagtta ggatctgatg 5160 
tggaacattg taagatcatt gctagaaaaa ctttgtcata atttttcaat attattctaa 5220 
gtgaaraacc gtaaagattt tacatcttag cttccttcct tacagraaaa aaacta:ctg 5280 
atctctrgat cagtattata gtagccacct atcactttat cttaacaaat tctcaazzcc 5340 
ttaggtrtat gtgcttttac ttcttttatt tgattaaaat tgctgtcatg acctctctct 5400 
gcagagggct gcatcatttt ggtcattctc aagtgatctc tttgagcaat ttaagaattg 54 60 
ccataagatt ctaacctctg ctgtaactat ggttgtgtgt tcttggttag accactaaat 5520 
cttatcagca gttttaaaaa ttattccttt tggtttagaa gttaagacta aatgctgaag 5580 
tttttgraac ttttggtttt gatatcatrt caaacttaag aaaacatttg aagaaaagga 5640 
caaagaattt ccacttaccc tttacccagg tttaccagtt attgataagt atatccattr 5700 
gctttaccag aaggctaact tgttttagtt ctcattttca cctttgagac atttggaata 5760 
aatatcaatg ttaacataaa ttggaatttt gactttgatt ttaggaccaa tgaacaagcc 5820 
aagtac-tac cctagtcata tataatccaa ctgtatggtt atttggtatt cattccacac 5880 
ttcattttac ttgatctccc ttaagattgc aagattgtgt ttgcagtttt tcigaaaatc 5940 
tggggctata aaagcatcag gacctccccc gtaggggagg tcgtgtgttt ggggtcctta 6000 
cacaacaggt tacccttgag cttcaggaaa agaactggct ctcagttccc cagttccagc 6060 
ttaatgggtc taattaggtc ctgaccaaaa aggtggcagt tcttttccct catgtctctt 6120 
cagcgcrccc cgagactctg gagactctgt catatcccta gggctgagcc tcccaggaac 6180 
cattcggctg ttgtggcatc tgtgtatgcc atgcccagtg ctgaggacct agtaacaaac 6240 
gacaaatgca caggcacagt ggcatttttg tggaactcgt attccagctg tgcgtctcag 6300 
aagaagcgca cagctccctc ctggctttct taacatagtg agccacttcc acttaagggt 6360 
ctccttacat tccttgagtt taatcattca tggattcaga ggaaagtctt ttgatttttg 6420 
cttttcrtta aacagttcat ttgaggtgac ctaccccagt gactttgcac caaccaccaa 6480 
gaaacttttt tgcatgcttc ccgcaccctg tgccaatcaa gggaagggtt taaaggcctg 6540 
gcgtttttat tcctcaaaga aaggttttgc acagtatttt aaggttcaag tgcttctact 6600 
ttgtgttcag aagcaactgt catatatact gtgaaatgac accttttart tatccctttt 6660 
tatttatgca gtatgtcccc ttttattttg gcagaatttt ttctaaatgg tggtttaaca 6720 
ttttcaagca catttcattg tccaatattc atagtaaaga atgagagtta acaataacca 6780 
g-tcacattaa aacaagattc ctgctgccag ttgtgaaacc ggttgtctta ggcgtggcag 6840 
ctgatgattg agactgtgat caggaaaatt tccactattt catcaggcct aataggtaga 6900 
ttgtgtctcc aaatgaactg tgttgggttt ccatgcttaa agcacaatag aggtggtgca 6960 
agaatctcca tgagggctta aatggcagtg atggttcagg cggtagagtt tggagaagaa 7020 
gggatttgaa acaaaccaaa ggaaagaaaa gtaagtagcc agaaatcaca aaatggcatt 7080 
tttctaaaaa caaaggaaaa ggaataaaag aactaataag tttgaaaccc ctacccctcc 7140 
caaatttggc agggggggag gtattttttt tctatctatc taactaaccc atctagaaaa 7200 
cagttgacca aattatagac ttctaaatgt taatctgctt tctcagtttc agttgaaaag 7260 
agactttgtt ttgcctactg cagaacttct aggttctttc ttatagtctt ggggttctta 7320 
ttatagatcg aaaatgtgag tcggcataat taagccattc ggagtcttca gaagcagttc 7380 
actcttgaaa tgactccgtc cgcctacagc catttaagat ttcagaacaa aaacagatct 7440 
tgattttctt tttcatgtta actcaagctg ttgctgagtg ggagagtcag aaatgacacc 7500 
agctccactg attactcagc tgctgaagga tgatttttta aaatgcacct ttactgtata 7560 
tggacttcct aatttccacc tgtagagcat cttagggagg ctaacatgtc actctggatg 7620 
ttcttttaga ataagatgca aatctatttt tctgaaggca ttagagatag caaacattta 7680 
ttgtgagttt actatatact aggcactgtg ctaagtgttt tgcatagaaa gtttaaaatt 7740 
ctggcttttt tgttggccca atcataagtt tcatatcagt tcaacattca aattatatta 7800 
aggtacttaa gaagaatccc tggctaaatg tgaggggcag tgccacagat ggactgaaac 7860 
tttatgctta ttgcacattt atgctattat tatttgttga attatagaac caagggagtg 7920 
tggaagccac tggaaaaaat atgagactta gatacataat ttgagtaaaa atggctcaaa 7980 
gtcatgaggg taaagttttt tgtatttcca ttttattcga gcggcatcgt ttttaaaaat 8040 
cattatgaat ttgaccctat atagatgttt ccaaataatt ctttttcacc ttcataaaat 8100 
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tccttcctgt 
tcctttacca 
cctcactgaa 
agaaatccct 
tagcgttctt 
gctggcagga 
gtcagcctag 
gacctatcag 
tagacgatga 
gaaggcatct 
ggcttgagtg 
tggtttccag 
ttcctgaagg 
ctagaactgt 
gtctttggga 
ttgaactggc 
ctccaggggc 
taggctgtct 
cagtttgaac 
ctgtgtatta 
tcctttaggt 
cccagtattt 
agagttttgc 
ctccacctcc 
ggtgtgcgcc 
ttggtcaggc 
gtgctgggat 
acagcaattt 
ttgttctgtc 
tgagtgagtg 
ttgtgtcgcc 
cttcagttct 
agagcagtct 
agagagagta 
acctctaccg 
gacgtgggag 
tgccagaaga 
ctcgctcccc 
aaagcctcaa 
ccggctctca 
gtttgggctc 
cgtacaacgc 
tgagcgctgt 
ctgtctacag 
ctctcccgag 
gggaggtgct 
tgaaggacaa 
cagaacatgt 
aagccatgaa 
cgctgaagaa 
gccagctctc 
atgcttgtgt 
gagcccccgg 
ttgactttgg 
gggtttggac 
gaaaaacacc 
cttaagatat 
cttgagagca 



ggctgtgaga 
ttttagcttt 
agaccgatat 
ctccctcagc 
ctctgtgttt 
gataacattc 
agaatacatt 
atagcaagtg 
aggatatttg 
ccacacattg 
actgtcctcc 
gcaaggctga 
catcatttat 
cctcattgct 
ataagtgctt 
tcaggaagta 
cagcactgct 
gcacatcgcg 
agggctttat 
cttgaaatga 
aaaccatgaa 
ttccactcca 
tcttgttgcc 
cagattcaag 
accacgccca 
tggtctcgaa 
tacaggcaag 
tctatcataa 
tgtgctgcca 
gcccagagcc 
agctgttact 
ctctagccct 
aaagcaaccg 
cagcgtgaaa 
ttctaacatt 
ccccgaaatg 
ctttttgaaa 
cattccatcc 
gagctccagc 
agagcaccgg 
ctaccctggc 
tcactacccc 
gagcagcatg 
caatctcctc 
ctcgctgccc 
tgtcccggcg 
ggcctgtagc 
ggtgcagccc 
tctcattaaa 
gcagaacggc 
caatctgaag 
ttgtatttag 
ttggggatag 
acaagtgact 
tagaagatta 
attctgaaaa 
ttgcatcaac 
gagctaacac 



tgccttgcct 
aaaaaacaaa 
tggcctgata 
aagctt tcca 
attctggggc 
tctaaggggc 
taaagggttc 
tggagttctt 
cacaaaggct 
acagccaatg 
aataat caga 
gcagggaatt 
tgtgtagcga 
gctgttccta 
tcctcttagc 
cctattgtgg 
gggatcctgg 
aggaaggtgg 
caaatt cgta 
gtcttaatct 
catcagaaag 
ttaaaatgga 
cagtctggag 
cgattcttct 
gctaattttg 
cttccgacct 
agccactgca 
ggtctgtact 
ttgtccgcat 
ttctagaatg 
caggttttct 
ctgtgtaatc 
agcactgaga 
gaaatcctaa 
tcacccctca 
cccttctacc 
gcttccctgg 
tccaccactc 
cctcacagca 
gactcctacg 
tacgcacccc 
aagttcctct 
aatggcatca 
ggtgggggca 
tcagatggag 
ccccacagtg 
cccacaagcg 
aaagctacct 
aacaaaagaa 
aagatcaagt 
gtaggccttg 
cttgctttcc 
tgggtatgga 
tcccttctcc 
ggtgaaactc 
catgaagatt 
acttgagtct 
atgtggcttc 



atcagttttc 
agtgacaatt 
aggagatatc 
tcacggcccc 
ttcaggctcg 
tctcaaattg 
agttctggag 
tctcaactaa 
tcagcatgat 
ccttcagtgc 
gctcaaacta 
ttcagttttc 
ggagac.aggg 
aatagtatct 
ctgttctgtt 
tttggcagag 
ctagaccaga 
tattcacttc 
ttcaacaaga 
ttcacattta 
acttttatta 
agtttttttr 
tgcaatggca 
gcctcagccr 
tatttttagt 
caggtgatcc 
tccagcttag 
aatgaaaaca 
tttgctgagg 
agagtgcgtt 
caagaaggag 
gccccttttt 
aaaatgaact 
aattggactc 
catcagaaaa 
ctcgggtcgt 
cctacgggat 
caagcccctc 
gccctgggaa 
cttacttgaa 
tgccccacct 
tgccccccta 
acaactttgg 
gcctgcccca 
cccggaggtt 
ccttctcctt 
ggtctcccac 
cagcagcgat 
acatgaccgg 
acgaatgcaa 
agagagagca 
atggggtatc 
ttccgcctgg 
tgattttctt 
cctgctagcc 
tcttcttttt 
tggagcagaa 
ttcccaggtc 



aagcttagt z 
agaacttcct 
tatt ttgtr- 
cccgt cagca 
cccaggagga 
gaatcgaatc 
tttcacagag 
attcaagcag 
cccccaaacc 
gtt cctaggg 
aacatcgtat 
cctgcccaga 
ctggctgtgg 
ttaccaagta 
ttcttgggtg 
gtgactgtca 
cagagcctrg 
gctaagctcc 
gtagaagcga 
gt t ctcaggg 
acctatgaca 
ttttttttct 
caatctcggc 
cccaagtagc 
agagatgggg 
gcccacctcg 
get atcttac 
gaat caccca 
aggaaaegga 
ggaagecaga 
gagcaacttt 
ctttatttca 
ctgcccaaag 
caacccctcc 
ggacct cgat 
ttaccccatc 
cgagagaccc 
tgeaagaage 
tacggtgtcc 
cgcgtcctac 
cccgccagct 
eggcatgaat 
cctcttcccg 
ccccatgctc 
gctccagccg 
taccggggcc 
ggegggaaca 
ggcagccccc 
ctacaagacc 
cgtttgcgcc 
gtccaagggg 
gattgeattt 
cttttgccac 
ctgaataata 
tgtgattttt 
aagactgtct 
atgttaggtc 
cacctgagag 



gtctttctca 
gcctgctggg 
tagtggctr z 
tcttccctga 
actgataacc 
cctcaagcca 
ttcai::cta 
agacatttt: 
tgctgcctct 
caqgzqzccz 
gttttactt- 
tgggtgtttt 
cagggatag" 
ataaegtgee 
cgctaagtaa 
cgccttgtga 
gtgaagtgcc 
ttggcaragg 
aaattgatga 
tatgetgatt 
gggtccccac 
tttttgagac 
tcaccacaac 
tgggattaca 
tttctccatg 
gcctcccaaa 
tccagcctaa 
aggctgetgr 
actgeacttt 
tatgtggcga 
ggcagttttg 
gcacaaacac 
aatgtcccaa 
aaaggaaagg 
gactttagaa 
cgggcccctc 
aegtacatea 
agccccgacc 
cctgtgggcc 
ggcacggaag 
ttcatcccct 
tgtaatggcc 
aggctgtgcc 
aaccccactt 
gagcatccca 
gccgccagca 
gccgccacgg 
ageagegacg 
cttccctacc 
aagactttcg 
ctgtgagtgc 
gcagtagtat 
ttctagctct 
aaaaaattag 
gtgcttttaa 
tgatgctttt 
teagagecag 
tgcacagtgg 
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agaacggcct ttcaaatgtc agacttgcaa caagggcttt actcagctcg cccacctgca 11640 
gaaacaciac ctggtacaca cgggagaaaa gccacatgaa tgccaggtgc gcagtattt" 11700 
ctgggtagac cttctgacct ttgtagaaaa -guctgtgag tcaccctccc azqtczzaza 11760 
tagcccgtag ttaaagccaa caccagaitc -gcgttgtcc catcctggac tgat ggcacn 11320 
atggtccttc ccagtacttt gtatctgctg atgacttgag atggcacagc cagcttccag 11380 
tgggtgggaa aatggtaggg gaaataaaca gcccctcgtg tgctgtgtgc ccaca:cccc 11940 
ccgtttgctt aataccacac tggaggtgcc acaaggaggc ttctcacctc ctaggttgct 12000 
gggcgttggc cggtaagcct gcccctcccg ttggcaactc ttaatcttct ggccttcctg 12060 
tctcccttcc ctgctgtctc tctcccctac actgtaggtc tgccacaaga gatttagcag 12120 
caccagcaat ctcaagaccc acctgcgact ccattctgga gagaaaccat accastgcaa 12180 
ggtgtgccct gccaagttca cccagtttgt gcacctgaaa ctgcacaagc gtctccacac 12240 
ccgggagcgg ccccacaagt gctcccagtg ccacaagaac tacatccatc tctgtagccc 12300 
caaggttcac ctgaaaggga actgcgctgc ggccccggcg cctgggctgc ccttggaaga 12360 
tctgacccga atcaatgaag aaatcgagaa gtttgacatc agtgacaatg ctgaccggct 12420 
cgaggacgtg gaggatgaca tcagtgtgat ctctgtagtg gagaaggaaa ttctggccgt 12480 
ggtcagaaaa gagaaagaag aaactggcct gaaagtgtct ttgcaaagaa acatggggaa 12540 
tggactcctc tcctcagggt gcagccttta tgagtcatca gatctacccc tcatgaagtt 12600 
gcctcccagc aacccactac ctctggtacc tgtaaaggtc aaacaagaaa cagttgaacc 12 660 
aatggatcct taagattttc agaaaacact tattttgttt cttaagttat gacttggtga 12720 
gtcagggtgc ctgtaggaag tggcttgtac ataatcccag ctctgcaaag ctctctcgac 12780 
agcaaarggt ttcccctcac ctctggaatt aaagaaggaa ctccaaagtt actgaaatct 12840 
cagggcatga acaaggcaaa ggccatatat atatatatat atatatctgt atacatatta 12900 
tatatactta tttacacctg tgtctatata tttgcccctg tgtattttga atatttgtgt 12960 
ggacatgttt gcatagcctt cccattacta agactattac ctagtcataa ttatttttte 13020 
aatgataatc cttcataatt tattatacaa tttatcattc agaaagcaat aattaaaaaa 13080 
gtttacaatg actggaaaga ttccttgtaa tttgagtata aatgtatttt tgtcttgtgg 13140 
ccattctttg tagataattt ctgcacatct gtataagtac ctaagattta gttaaacaaa 13200 
tatatgactt cagtcaacct ctctctctaa taatggtttg aaaatgaggt ttgggtaatt 13260 
gccaatgttg gacagttgat gtgttcattc ctgggatcct atcatttgaa cagcautgta 13320 
cataacrtgg gggtatgtgt gcaggattac ccaagaataa cttaagtaga agaaacaaga 13380 
aagggaatct tgtatatttt tgttgatagt tcatgttttt cccccagcca caattttacc 13440 
ggaagggtga caggaaggct ttaccaacct gtctctccct ccaaaagagc agaatcctcc 13500 
caccgccctg ccctccccac cgagtcctgt ggccattcag agcggccaca tgacttttgc 13560 
atccattgta ttatcagaaa atgtgaagaa gaaaaaaatg ccatgtttta aaaccactgc 13620 
gaaaatttcc ccaaagcata ggtggctttg tgtgtgtgcg atttgggggc ttgagtctgg 13680 
gtggtgtttt gttgttggtt tttgttgctt tttttttttt ttttttttta atgtcaaaat 13740 
tgcacaaaca tggtgctcta ccaggaagga ttcgaggtag ataggctcag gccacacttt 13800 
aaaaacaaac acacaaacaa caaaaaacgg gtattctagt catcttgggg taaaagcggg 138 60 
taatgaacat tcctatcccc aacacatcaa ttgtattttt tctgtaaaac tcagattttc 13920 
ctcagtattt gtgtttttac attttatggt taatttaatg gaagatgaaa gggcattgca 13980 
aagttgttca acaacagtta cctcattgag tgtgtccagt agtgcaggaa atgatgtctt 14040 
atctaatgat ttgcttctct agaggagaaa ccgagtaaat gtgctccagc aagatagact 14100 
ttgtgttatt ctatctttta ttctgctaag cccaaagatt acatgttggt gttcaaagtg 14160 
tagcaaaaaa tgatgtatat ttataaatct atttatacca ctatatcata tgtatatata 14220 
tttataacca cttaaattgt gagccaagcc atgtaaaaga tctacttttt ctaagggcaa 14280 
aaaaaaaaaa aaaaaaaaaa gaacactcct ttctgagact ttgcttaata cttggtgacc 14340 
tcacaatcac gtcggtatga ttgggcaccc ttgcctactg taagagaccc taaaaccttg 14400 
gtgcagtggt ggggaccaca aaacaaccag ggaggaagag atacatcatt ttttagtatt 144 60 
aaggaccatc taagacagct ctattttttt tttgccactt tatgattatg tggtcacacc 14520 
caagtcacag aaataaaaaa ctgactttac cgctgcaatt tttctgtttt cctccitact 14580 
aaatactgat acattactcc aatctatttt ataattatat ttgacatttt gttcacatca 14640 
actaatgttc acctgtagaa gagaacaaat ttcgaataat ccagggaaac ccaagagcct 14700 
tactggtctt ctgtaacttc caagactgac agctttttat gtatcagtgt ttgataaaca 14760 
cagtccttaa ctgaaggtaa accaaagcat cacgttgaca ttagaccaaa tacttttgat 14820 
tcccaactac tcgtttgttc tttttctcct tttgtgcttt cccatagtga gaatttttat 14380 
aaagacttct tgcttctctc accatccatc cttctctttt ctgcctctta catgtgaatg 14940 
ttgagcccac aatcaacagt ggttttattt tttcctctac tcaaagttaa aactgaccaa 15000 
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<210> 66 
<211> 46340 
<212> ADN 

<213> Homo sapiens 



<400> 66 

tattttactt 

t caggatcaa 

ccatctgcag 

ttgaaaaagg 

tatatcataa 

caacatcaca 

taattctgag 

ggacccttca 

gcattttttc 

gctgaatact 

ggataaatgg 

cttaggtaca 

agaagtgcca 

ctctgccacc 

caggt tcaag 

accatgtcca 

gctggtctca 

gttacaggcg 

gagacagaga 

aaaataaaaa 

tcattatttc 

atctgacaaa 

tactcttaaa 

cagagtacag 

ctatgatctt 

tttgttgtgg 

gagaataaaa 

taaattttaa 

atacatacat 

ttgaattgca 

gggactacag 

tctcactatg 

cattagcgac 

acacaactgt 

attctcagca 

gggagctgaa 

tcggggagta 

ggctgatggg 

tctgcacatg 

gtagaaaaaa 

cactgaatac 

gtatgaaaat 

cttcactatt 

gttttggctc 

gagggactgt 

cctcatgttg 

gcagtttttc 

tttctgccat 

ttaaaccttt 

acagactaat 

aacaatatca 



cagtaacaga 
tagcagaagg 
ccacaggacg 
aaaaaatgat 
actttatgtt 
gatgtggtat 
gaaacagaca 
aaaacttaaa 
tcagtatctc 
aaattgaaga 
ggaaatacag 
ataaggacaa 
tgatatccaa 
ccggctggag 
tgattctcat 
gctaactttt 
aactcctgag 
tgagccaacc 
gagagagaaa 
aatattaact 
aacttttcga 
aactgttagc 
attgtttcat 
aggctctgaa 
gtacccagtt 
aaataaatga 
gcatttttac 
gctttctgag 
attttttgtt 
gtggtgcaac 
gtgtgagcca 
ttgcccaggc 
aaggttttgt 
tagagatttg 
aactaacaca 
caacgagaac 
gggggctagg 
tgcagcaaac 
tattccagaa 
taaacatgta 
atagtatttt 
tgtaattttt 
tgaactcttt 
tgtgtttcca 
aatccccatg 
ttctcgtgat 
ctgcactctc 
gattttaagt 
tgcctttata 
acattcttca 
tgcataatca 



aaatgaaaga 
acaaacttct 
aaacagcttc 
tcaagcaatt 
ggcattaggt 
cactgtgaaa 
aatccaaagt 
gacattaaaa 
ttaaagagac 
aggacatttr 
aatggacaac 
tccttatttt 
aacttaatct 
tgcagtggcg 
ggctcagcct 
tgtattttta 
ctcaggcaat 
gctcctggcc 
gagagagaca 
aatggtgatt 
taggtttcac 
agcactacat 
ttactaaatt 
atgagccagt 
tcctttatct 
gcaactttgc 
ctcctctctc 
atgaaaaatc 
tgcttgtttc 
ccccaagttg 
ccatgctcag 
tgcctcatat 
ttttgtcttt 
gtttaaaaag 
ggaacagaaa 
acatggacac 
ggagggatag 
caccatggca 
cttaaagtat 
agcatgtgag 
aaaatagtaa 
aaaaaatctt 
agggattatt 
tccaaatctc 
tgtcgaggga 
actgagtgaa 
atctctcttt 
ttcctgaggc 
aattatccag 
atttaaaaag 
agtgattaac 



aatgtttt aa 
ttgaggagat 
tgaatgaaag 
aagtctttgt 
gccttttgat 
aatgtttaac 
tgggtgggac 
agcaaacaac 
taacaaagca 
ttagaaatcc 
tgataatatt 
taagaaattc 
tctttctctt 
cgatctcagc 
cccaagtagc 
ctagagatgg 
ctgccggctt 
ccaaaactta 
gagaatgtgt 
ctaggtagag 
aatttccaaa 
cgtaattt at 
tccttagtga 
gtctatgaag 
gttaatttgg 
caaccacaga 
cctcttaacg 
attaaaactt 
ctgagacaag 
caatcctcca 
ctaatttttt 
tttataagaa 
taatgacaga 
aaatagacat 
accaaacacc 
aggcagggga 
cattaggaga 
catgcatatc 
aatacaaaat 
ctgcctttcc 
tccaataata 
gataatatgc 
tttaaaaata 
atctcaaatt 
gggaggtgat 
ttctcatgag 
cctgctggct 
ccccacaagc 
tctcagatat 
ccatactttc 
tgtgtaaaga 



tgttgctgat 
ctcctagtgt 
gtctt tcagt 
tgct gccaat 
acggtgttag 
atgataaatt 
attctaaaga 
acaaaaagat 
aatacaaaac 
aact atgaaa 
artgagttaa 
attgt tcaag 
tttttggaga 
tcactgcaac 
tgggactaca 
ggtttcacca 
cggcctccca 
accat ctaat 
gtgtgtgtga 
ggtgtatgat 
acagcagatc 
tgctaataat 
tgatggaggc 
agcaccactg 
gacattccat 
gtaaataaat 
gttatttcac 
aacaagaaca 
gtttcactct 
cctaagcctc 
tacttttttg 
tatgactt ca 
ggtatacctc 
ggatgaagct 
tcatgttctc 
acatcacaca 
aatacctaac 
tatgtaacaa 
gaaaaaataa 
taatt ctatg 
tatttgagtg 
attgaatatg 
tgattgatat 
gtaatcccca 
tgggtcatag 
atctgatggt 
tgtgaaggtg 
catacggaac 
ttctttaaag 
tcatacaagt 
taataaggtt 



tgtattacct 
gtgcaactgt 
cgttgtctat 
tacaaattta 
cataattaca 
caggtaaatc 
taattggctg 
atcaacaaaa 
at aaaccatg 
cacagtt ttg 
tgtcaaattt 
tgt ttaggaa 
cagagtct eg 
ctctactttc 
ggagtgcgcc 
tgttgcccag 
gagtgttagg 
ggttgagaga 
agacaaagca 
tttagtagtt 
cagecatt tc 
ctcattgttt 
t ttatcatga 
tttgeaagat 
atctcttgag 
aaatgttaaa 
tttaagaugg 
gagaaatgee 
gtcacccagg 
cagagtagct 
tagaaggggg 
aacacttagg 
aacatatttg 
ggaaactatc 
actcacaact 
ccaaggcctg 
gtagatgagg 
acctgcacat 
ataaaaataa 
tttatgtatt 
tttgtgacaa 
atttaattca 
cctttgatat 
cccgtctagg 
gggtggtttt 
tttaaaagtg 
cctgcttccc 
tgtgagtcaa 
cagagtgaaa 
tgaaaccaag 
gaggagttca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 / 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 
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gagaagaaaa gaaatgaata gggaactgta gtgataattt aaaatagcca tccctcacrc 3120 

agggtttttg atcttcaggc catgaagaag cttttaatgc tttttagcaa aggaagtaat 3130 

gttggtgaaa ggctttttct gacgactaat ggaaagcagt gctatgtacg gtgacttggt 3240 

tatgaaccaa aaccagaatg actggtgaga ggctgactga acacagcaag cttatgrgaa 3300 

gacaactgga gctggtgcag tggaaaagga agacagcagg actgtaccca caactcaaag 3360 

aaaaaagtca gaaggtacct cccgcagtcc aacctgaaaa caacaaag-c aaaggaatct 3420 

tttcaagaat ttggagctct cattcatatc ctaattagtg tatgaaatgr gaggtggctt 3480 

tgctataatg aaattacctg gaatatttct aacacaaaga aataataaat gcttgaggrg 3540 

gtgaatatcc tcatttgatc attacacatt gcatgcttat agcaaaagat tacatgracc 3600 

ccataaataa ttgcaactat tatgtatcca taataattaa aactaaaaga ttaaaaatta 3660 

cctgaaaaaa aatgctaaac aggaaaggcc aactagtctt gcttacaca: taaaaaacag 3720 

aaattcttct ctaacctcac tattggagaa atatcctgtt atttttatat atcttttrtt 3780 

tcaccctttc ccaaatctga gcaagtatta taaaggtata accttcaaca atcttttatg 3840 

atgaggtatt tgcttactgg ggacaaagcc ccagtgctat tacatagtgt agctaaacgc 3900 

tgtagaatgg taaaaacaag aaaatgctca gcaaagtgtt gtttctcatt taatgaaaau 3960 

cttattttaa aacacaaaaa ctcaatatac cccaaccaaa aatctgatga acattttctg 4020 

tttaatattt attatacagt acctttaaaa acgtaatatt cttattct~a aaaatttagt 4080 

gtgctagcaa atagcaatta agtacctaag tcaatcagga cgacaaaaaa atactcaatt 4140 

tggggagtta gttacttcta tcatctgaat gcgtccctcc aaaattcatg ctgaaaccta 4200 

ttcctcatca tggcagtatt aagaggtgaa gcctttgaga ggtaattagg tcatgagggc 4260 

agagtcctca agaatgggat caatgctctt ataaaagagg ccccagggag cttgtaaggc 4320 

ttttgcccct tctgccatgt tgggggggtg ggggtggggg cgcagcaacc agtgctaact 4 380 

ctgaagcaga gagcagccct caccagaaac cgaatctgtt gaagccttga tctctgactt 4440 

cccagcctcc agaactgtga gaaataattt tctgttgttt ataaattacc cagtctaggc 4 500 

tgggcgtggt ggatcacctg aggtcaggag ttcaagacca gcctggccaa tatggtgaaa 4 560 

ccccatctct actaaaaata cagaaaatta gctgggcata gttgtgggcg cctgtaatcc 4620 

cagctactca ggaggctgag gcaggagaat cacttgaacc cagaaggcag aggttgcagt 4 680 

gaatcaagat catgccattg aactccagcc tgggcaacaa gagggaaact gtctcaaaaa 4740 

aaaaaaaaaa aagtacacac tctaacatat tttggtatag cagcccaaat ggaatggact 4800 

aagacaatta cccttaaaat aaaagctccc atagagagat catgcattca agtacagagg 4860 

ttcttaaggg caatgggaat ggaggacata ttcctgcaaa cttttcaaca gctctcatta 4 920 

gcccgangtt agagctctgc aaagaagact aaattatact gagaaatatt tttaaatctc 4 980 

cacaaatagg aatgctgtaa acgttgattt agtatatata aaattagaca agactaacaa 5040 

tatccaatgc aatctaaatc ttaggttgac agacaagaaa gccactgcaa acaggaatat 5100 

accacaatac ctgatcttgc cacatatttg taaatatgca aagtatttca ataacttcca 5160 

agaaacagta ttactctcat gagaaataac atgatgtaag tcacctttga aactgtcctt 5220 

gttacttttt caaatgtatg ttagtcattt cttaacacca aatgaaatga aaaactgagg 5280 

tggtaatggc tggctgctcc catctctcct ctactcatgt gccttcacca atacagcaat 5340 

cattttttct tatatgggaa atttacagtg ttgatatagc tcagagatat attgaagaaa 5400 

agcagaaaaa cgaaacttat aaacatttta ggaaacctta tgtattttct taaatagttc 54 60 

aagtgtaaaa cttagaattc ttataaataa tgtgtgttac agctatattg taaatggtgg 5520 

ctcatgcctg taatcccagc acttcaggag accgaggtgg gaggagagct tgagcccatg 5580 

agtttgagac tcacccgggc aacacagaga gacctcatct cttaaaaaaa aaagaaagaa 5640 

agaaagaaat gaaatgcaaa gaaaaagtct ctatttcaaa tgtagccagt agagccaata 5700 

ggttaaccaa tattaacatt aacgttgata aaacaagaaa tgatgattta ctataagctg 5760 

aaaatcagac aatgtatgga ctttaagagt aacaggcacg atcatcacaa acttaaatca 5820 

ggtttgagtc ctatgagtta tatacagtta catgatgcaa caaaagatgc cagccagttg 5880 

ttaaagagta ttagattcgg ctgggggtgg tggctcatgc ctgtaattcc agcactttgg 594 0 

gaggccgagg agggaggatc acgaggtcgg gagtccgaga ccagcctggc caatatagtg 6000 

aaacctgatc tctactaaaa atacaaaaac tagtcaggca tggtggcacg tgcctgtaat 6060 

cccagctact cgggaggctg aggcaggaga attgcttgaa cccagggggc ggaggttgca 6120 

gtgagccgaa atcgcgccac tgcactctag cctgggcaac agagcaagac tctgtctcaa 6180 

aaaagagtat tagattcaag tcctgtttct gtcatttatt atggaaccat ggacacaact 6240 

acctatcttt cctgaacctc agttttttca actgcaaaac aggaatatat acatatgtgt 6300 

atatatacat ctgtgtaaac acatatgtgt atatatacat ctgtgtaaac acatatgtat 6360 

atgtataaat ggagataata cctacattat agtttctgag ataataaaa: gcacaacaca 6420 

attctgacac ataacaattt gtaacttaaa acataccatc accagggcca ctagttttag 6480 

aacactgtaa tgcatagtct aatttaatac tatgcaaact gtgttcactc aaggttttat 6540 
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ttccttttaa 
tgaaattcag 
aagtcatttt 
taaaagggaa 
cttttgttct 
aatatttgca 
aaattcaaca 
acagacattt 
cacatcatta 
taccaaaata 
aatagtcctt 
tatggcagtt 
tgaatattcc 
tgttttattc 
gaatgcttat 
ggaacaaact 
aaaaaagtca 
atgacaaaaa 
gcagtaaggt 
gggtatattt 
acacacacac 
tacaatttcc 
ctagatgaag 
attatctcaa 
atcaaagttt 
tagattctca 
caagtgattc 
caacctactc 
ttggacagtg 
caggaaaagc 
agaacagtca 
ggcagataat 
gaaccaaaat 
aatgaatgta 
cttttactct 
tcaaataatt 
cacatattct 
cagctctgtc 
ttgtgtgtca 
tttttgtgaa 
gaattctcaa 
ctactgaatt 
catatactat 
tttggtcata 
aatgaccatt 
ataaagagga 
ataaaaagct 
ccagtagatg 
cacggatgga 
aaggggctca 
taatcccagc 
gcctggccaa 
gtggcgtgca 
tgggaggcaa 
agtgagactg 
atttgctcca 
atattatatt 
catcagctac 



tttcattcat 
aagcttacgt 
aacactactt 
tactaataaa 
gcaaaagatc 
aaccatattt 
gtt tttaaaa 
taccaaagag 
gccattaaag 
tccaaaataa 
cacacactga 
tcttacaaaa 
cagaagtaaa 
gtgagagtca 
aaactgactg 
actggtatat 
atctcaaaag 
ttttagaaat 
aggtggctgt 
tgaatatagg 
agtatatgta 
tggttgtgat 
ggtatgtaga 
aataaaaatt 
tctctgagga 
ggctgcatat 
atgtttaaag 
taacacactt 
actctcaaca 
cccttaggtg 
attaaggctc 
atatactata 
cagaattaaa 
gtctaagtaa 
tcatacttcc 
tatggcctgg 
agctctggat 
aattagtacc 
attgtatcat 
ggttatacaa 
tgagtgttat 
ctaatatgta 
tcttgtagtc 
catattgttt 
tatggctaga 
ggaagaatgc 
atgaaagaga 
cacaatgcac 
ggtgctgggg 
agtttattta 
actttgggag 
catggcgaaa 
tctgtagtcc 
aggttgcagt 
ctcaggatct 
gtgaggctta 
gataatttat 
tttgtgtgtg 



ttactcttca 
tttaatgttt 
tcaaaatcag 
tagacttaat 
ctgtgaagag 
ccgagaaagg 
aaagcaaata 
aatatatagg 
aaatgcaaat 
aaattagtgg 
tggtacaaat 
ctaaacatgc 
aatgtcttct 
aaaacagaaa 
taataggtct 
gcaacaactt 
gttacacact 
ggaaaacaaa 
ggctataaaa 
gtgaatttac 
aaactaagga 
actgtactgt 
tctttctgta 
tttttcaaaa 
cctgtagcat 
tggaattcct 
tttgagaagc 
gaaggccata 
caaatgagtg 
atcctgatga 
aaaacaaaag 
acagagcaaa 
atcactaagc 
atactaataa 
tagtcacaaa 
tacagtaata 
ggcacttgat 
tatatgaccc 
ctataaaatg 
ttaattcata 
aattgttctt 
ttctgtattg 
aaccctgtta 
tacatacatt 
agggtatata 
catcagagta 
aaaacataaa 
tgggttgtaa 
gagtctccta 
aaaagagatt 
gctgaggcgg 
cctcatctct 
cagctactca 
gagctgagat 
cccaaagacc 
gatggacatt 
gtatgttgta 
tgctttgttt 



gttgtttgta 
ttctatatgg 
cctagaactt 
taaaat taaa 
aat gaaaaca 
tcttgtgtct 
acccaattag 
tggcaaataa 
taaaaccaca 
taacaccaaa 
gcaaaacagt 
acctaccata 
ccaaaaaact 
gcaatcccag 
gtcccacgga 
ggatagatct 
gcatgactcc 
ttagtagttg 
gggtagccta 
atatgtgata 
aatctgagta 
aattatgcaa 
ttatttctta 
tttcaaaaca 
tttggttatc 
gaattggaat 
actagtctac 
acaaaattca 
aggaaaggtg 
aatgttttct 
taatgtttat 
ggtaattatt 
acataatgaa 
tggcagttat 
catctatttc 
agagcatgat 
gacgatggat 
tagtcaaata 
aggatattaa 
taaagtattt 
tttaaatgtg 
agctgtcaaa 
ctatgttatt 
aagaattatt 
tctggctcac 
aaaggagatt 
ataaccaaag 
aacttaaaat 
cggacacagc 
ggacaggccg 
gtggatcatg 
actaaaaata 
ggaggctgag 
catgtcactg 
caaatccctg 
ctagtcttct 
tttttcaagg 
ttaagtcttt 



agctaaaaag 
caaggaaaaa 
aacactaaag 
caacaacaac 
taagccgcag 
ataatatata 
aaaatgggca 
gcatatgaaa 
atgtgatatc 
tgctggtgcg 
acagtccctc 
tgaccaagta 
tatacatgaa 
ggctacccat 
atactactca 
caagggagtt 
actgatataa 
tcagaggtta 
agagat cctt 
aagattgcat 
aggt ttgtgg 
gatgttagaa 
caat tgcatg 
actagtctag 
acctggatct 
ccgcatttta 
aacaatgact 
catcaataac 
gggactcaag 
ccatcctggc 
aatactggag 
acaatgtata 
aatccttt aa 
agtgagaaaa 
caaaactgac 
atttaaagcc 
tcagcttatg 
cttaaacctt 
cagtatatac 
agaacaatgt 
acttgactct 
aaaaataagg 
actagtgtca 
agaaatgttg 
tgactgtgga 
ctattcactg 
gggtgaaact 
ggccttaatt 
aggcagaatg 
ggcgtggtgg 
aggtcgggag 
aaaaaaatta 
gcaggagaat 
cactccagcc 
taaactgaat 
tggttgagct 
tatagcaaca 
tgaaacagga 



tccagaatca 
aaaaagggca 
gcatgacc:a 
aacagcuaag 
gctgggagaa 
agaaciccca 
aaagacatga 
acatatccca 
att acacacc 
catgtggaaa 
aggaaaggag 
at tataetc" 
cgttcacagc 
taaaacaggt 
gcaataaaaa 
atgttatgtg 
cattagtgaa 
gggaagaaat 
ctgttgaaac 
agaacraaa: 
att atart aa 
ttgggggaaa 
tgaatctgt a 
agctttgtta 
tattaaaatg 
acaagatttc 
tttaaccttt 
agttgctcgg 
actcaggtag 
tgaaaaaccc 
at ctt taaaa 
aatcttataa 
aaagtataaa 
gctctagagt 
ccttcgtat t 
agtcagaaga 
gttccaatcc 
cttgtgttac 
ctcatagatt 
ctagcacagt 
caacagaact 
attataataa 
gttttgttgt 
gtttattaaa 
gtcaatgtcc 
aaacaaagtg 
taacagatgc 
aaaagccaag 
taacaatgac 
ctcacgcctg 
ttcgaggcca 
gccgggagtg 
cacttgaacc 
tgggcaacag 
gcataatatc 
gaagaaacaa 
agtttttatt 
tggtgattta 



6600 
6660 
6"20 
6*750 
6840 
6300 
6560 
7020 
7030 
7140 
7200 
7260 
7520 
7330 
7440 
7500 
7560 
7620 
7630 
7740 
7300 
7360 
7920 
7980 
8040 
8100 
8160 
8220 
8230 
8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
1CC20 
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ctacatttat aagtaaaatt t at t tgattt acaagggttg cttaagtgta tcacaggatt 10080 
tcacttgtta tatttgcagg tgcttaaaaa atcagctata ctaaactata actggaatta 10140 
gcaaagttca tttattgatt aatcaagaat ataattagat ttgcctaact atataagtag 10200 
tactatgtgt tatttaagaa ttaaatctag aaaagggatg gactctggaa atatcaagaa 10260 
gtgaaaaaga ctgctctcat ttttgtacaa caattactaa atttctaagt agcattaatt 10320 
gaactgaaaa ggcattttag aaaaactaga ttttacaatt tataactcta ataaaacaca 10380 
actaactatg agtgtgcttg ttcatgccca aaagctacct tccaaaatta aaaaccctat 10440 
tggatggctg ggtgcagagg ctcatgcctg taattccagc actttgggag gccaaggcgg 10500 
gcggatcacc tgaggtcagg agttcgagat cagcctggcc aatatggtga acccgtctct 10560 
aacaaaaata caaaaattag ccgggcgctg tggcgggtgc ttgtaatccc agctactcgg 10620 
gaggctgagg caggagaatc acttgatcct grgaggcgga ggttgcagtg agctgacacc 10680 
gtcccactgc actccagcct gggcgagagc ccagagcgag actccgtata ttaaacaaaa 10740 
caaaacaaaa ctcaaaaaac cctattggca attactaggg ccatcaaatc agtatatttt 10800 
cacttgacac acaattttga gataatgaac cgaacttact arttttgaaa atattacata 10860 
ataaatatta gtgaagcttc attgctgaaa tggtgacaaa gatgaatagc aataaaactt 10920 
ttcttataga tctttagcaa aaacaaaaaa accccaagca tactatggta cattacttta 10980 
gagaatcaag tagctgctag ttgagtaata gtggtaatag gcactacaat gatataaaca 11040 
aattacaaca aagaatattg tttttatttc ctgtccatgt tttaaaaaag ctttggtttt 11100 
acctatgttt aacaaaagca taggtacaac aacgactact actactaaca tataagtagc 11160 
ctggatagaa ttatcttaat agtagtaccc aagtgcagga tctctaagta atgatcagaa 11220 
ggcaggaata aattttatca gaaatcttca ttcattacat atttactatg catttaccag 11280 
ggtatcacta tgctaatgga tacaaagata aataacatgc aaacaactgt aatacagtgt 11340 
tatgtgataa cagaaatatg tacaaagcac tatgaaaaaa attacaaagc ttgagcacaa 11400 
attttaactc tggacttact ggcatttaga gcaaaaccaa aacaatccta actggttaat 11460 
ttcattttct aagagttgga agctatatca gtaggtacaa agtaaaatat gctaattgtg 11520 
gtagaaagta aaatattaca acagtagaga atttcaaaag aagataaaaa taatggaggg 11580 
aatatagaag gtcttcaagc ttccagcttg aaatacatat ttttttttaa atagagaaag 11640 
agataaagtc atttgagtat tcagagggca gactgaatat aatggtactt ctgagaaatc 11700 
agtggataag gagagaaaag tggactaaag gccatagcat atagagcttg gaatgtcaaa 11760 
tgtagtggaa ataacaaagg tttggttgga atcccaactc ccaacaacgt actgtgtatc 11820 
tagagcaaat tacatcaacc tttgggagta ctgtttctga atctgaaaaa tgaggaaaac 11880 
ttatctttga acaattgatg tgataattaa atgagatata tgaaatatct aatgtaacaa 11940 
gtgcttaaca atgactagtt cttttcattc ctctcttgaa ccattgtgaa acgtagaacc 12000 
aagaaaggta acagtattta gttgttacag aacccattaa gagagaataa aaaataactg 12060 
gtattctaac ttcagtttcc tttgaagtct tgttaatgag aataaatatt atgtggcaca 12120 
aagaaaaaga aaacaggggt ttacacagga tatgctgcca gactttacca acaatgacac 12180 
atgatatctg cttcaactgt cccatgcata tttggcttaa gatatattca tgcatatcaa 12240 
attttacatc acatggtttt caaaagaaga ttcattaaaa ttagcttaag aatgtacaca 12300 
atatacaata cctcattaaa taaaaagaac agaccatttc caaatgaatg cttttagagc 12360 
tttacagtaa acagtctttt ggtggtagaa agagggggaa cagagagggg agtgggtggg 12420 
agtctgtagc acttatcaga ctacttttat cctttatgta gagaaatagg agagttgaaa 12480 
ataagcactt tctgtactta tgttgagagt ctgaagccca cttttaatag tcttgacaac 12540 
actaaaaaat aataattaac atttgaaaag ctgtcattat tatagtcagg gacacttaat 12600 
ctccaaagga gaagtttctt aattgatact atgattaaat aaaagcatcc atcagaatta 12660 
tatccacaat ctggtttgga gtttatgttt tgtcttattt aaattgttat acttattata 12720 
attctgtcta gacagtgcca aatgtacttt gtcatacaaa cacttgaggc aaattttctt 12780 
caaataagcg caacactttg tttcctcttc gtatcctttg actgaataac gtgtggtaca 12840 
gagaagtaat acttcccttt cttgggatcg agatcaattt gatgcttgtt ataagcccat 12900 
ttacagaaca aatggtattg cttttaaatt tttatatgaa cttatcagta gactagccaa 12960 
aaaagaagct tcatataaaa gtgctaggat tgatattctt agtaataatt aggtaaattc 13020 
tctaaaattt tctcccaaaa gatctgaaaa atcataccaa gggaagtata gtttaaattt 13080 
cattatatat aatagcttta aaatatcttt gctaattcta cccaaagcca cactaaaaag 13140 
actaatacaa aaagaatgta attaataaac tattttcctc tgaagaatca aagggcactt 13200 
ctgcatatga acatgtttta tccttttggt gtacttacat aaaataatta agaaacactt 13260 
ttaattagta taaacaaaga aatcaaaata gcaagaagaa atgtctgagt aaaagcagct 13320 
gtgctgacct caaaagtgaa attctgttct cttgatgccc agttaagtgt ctaacccagg 13380 
gaaaagtgat tctaaacctg ggctaggagc tagtggagct cttcaaacag tctcacctac 13440 
cctcacccct caaggaatgg tctatgggtt ctgtggtgaa cgctaaagtt tataacatgg 13500 
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gaatatttat tattttgttt ctaacacaaa t aatttttaa aaattiat'c tactaaagta 13560 
acatcaaagg gaaatttcat aaaaattctt ttgaaatttt tagaagtagc aaataaagc: 13620 
aagtgataaa tattttacag atttcaccac ttacgtaatc cgaccaacaa attttaaaaa 1368C 
catagcactt gaatactatt aaaaatatat taaaaaggta acatagtaaa aciataaaa: I374 C 
tctttaaaaa aaatataaga ggaaaccttc gtgaccttgg attaggaaar ggtttcttar 13800 
atacggcaac ctaaaaatac aagcaaccaa agaaaaaaac agacaaac:g gacttcatca I386C 
aagttaaaaa cttttgttct tcaaatgaca tcatcaagaa aataaatccc acagaatggg 1392C 
acaaaatatt tgcaaaccat atctgataag agaccactat tcagaata~g taaagaatt: 13980 
gtaaaactta taaataaaaa gttaaagaag tcaattttaa aacgagcaaa ggatctgaac 14040 
acaattctcc taagaaatac gaatggctag ttaaatgcat gaaaagatgr ttagcatcac 14100 
tggtcattag gaaagagcaa aaaccaaaat gatatactcc ttcataccca ctaagactg; 14 160 
tgtaatnaaa actatagaaa ataagcgttg gcaaggatgt ggacaaat.g gaaccctcc: 14220 
catacactga tggtagaaat gtaaaatggt gcagatgctt tggaaaacag tctgacaata 14280 
ccccaaaggt ttaaacgtgg aattaccatg caacccagca attctactcc taagtatcua 14340 
cccaagagaa atgaaaatat atgttcacca aaacatttgt acataaata- taactgcagc 14400 
ttttattcat aatagccaaa aagtggagac aatccacatg tctatcaat: ggtgaattga 144 60 
taaacaaaat gtggtatctt catacaacta ttactgggcc araaaaagaa tgatgtattg 14520 
atacatgcta caaaatgaat gaaccttaaa aacaatatgc aagcaaaaga aaccagaca: 14580 
aaaaggccat atattacatg atgctaatta cataaaatgt ccagaaggga gaaataaat: 14640 
agtagttgcc aagggctgga gggaggggga atgatataag tgactgccaa tgggcatgcg 14700 
gtttcttttt agggtgatga aaatgttctg aaattttatc acgggaatgg ttgcacaac: 14760 
ctgtgtaact tagaattcag tgactcctaa aaccaatgaa tagcatgczt taaaaggtga 14820 
cctttgctga gcatagtggc tatagtccta gctacttggg aagctgaggc aagaggatca 14880 
cttgagccag gagttccagg ctgtactgca ctatgatcat acctgtaaat agccaccata 14940 
cacaccagcc tgggcaacac agaccatgtc tctaaataaa taaacaaata aataaataaa 15000 
agggtgacct ctgtagtatt gagattatac ttcaagtaag ctgttattaa aaaaaaaaaa 15060 
gttatcatat gggtggcagg ggaaatcatt ctgggatgat ggctaacttc atcagtattt 15120 
gatttatacc tatgcatcat accttatgtt tgttttatgc attttgtggg ttttttaaaa 15180 
aaattatatt tcataaaaac aaattttaaa aaaattaaag tcaagaaccc caaaacaaca 15240 
aagatcagag atacatttct accttatcaa ttcagaaaaa ttacaagt" ttttcttaaa 15300 
aattgtatag catcatggtg attttaagtt acctgtagga atttaaataa ctttgtctta 15360 
actgttcacc aaaactcatt taatattcat gttctgatac tgaaaatgaa gctgaaaagt 15420 
tttgaaatta caatatgcta gtttaaaaag gtttactaaa atacataart tcattataag 15480 
gagtaatatg aaataaaagt atcaaatatg ggaccattaa aaatgtcc" actaacaaa- 15540 
tgctacccac attgtggact cactgcgtcc actgtttgcg agcttttcca gaacgctcgc 15600 
caccagttag ggtagccaag aactcctcat cttcactttc ttcctcacta gcttggaacc 15660 
tctggattcc cacccacact gctgtgacct gaatggggaa gagaaacgce atagtaaggg 15720 
aactcttcct tttatagatt tctgaattag aatctggcat tacaaaagaa caatgttata 15780 
aatccaggtc agagtttata gttctatttc actattactt atatggctrg tcctaggaac 15840 
ttaactatta tttacaatgt aagtacctat ttccacaaaa aaattcaaaa ttttggaata 15900 
caatatctga agagagaatg gtctattgaa tccaaagtag gctgatacat cccaacagta 15960 
tttcagattg agataataat aataccacca attcatcaag tcaaattara tgcttatttt 16020 
ccacaatgga agttttaaaa tagtataaac attttaatat atagcaggct taacttatga 16080 
ttattaaaca gggttctaag aaaatagtat acatcaaata ttaatgtgct tcttgtataa 16140 
tttaggtgac aatttatcca tctgagaaat gcaaaagaga ctttggtaag gggttgagta 16200 
aggagcattc tgtgtcaaag aattcactag caaaagaggg tatactgtag ttacaagcta 16260 
taatcactgt acttatttta aatccctctt cagaaccagg tcttaaaaga tgataaaca- 16320 
ggcctcatga ataactatca accaaactat agaaaagagt gcaagagtgt ggtgttctaa 16380 
cttaaaatat ggtgttttat tcaaataatt ttatttaagg ctccaaaacc agcagcctca 16440 
ttccccagaa atcatagtta aatgaaatct tccttactaa aggaaaaaig aatcacaana 16500 
tttaacgtga acattttaaa aacactctaa agcaacaaaa ctattcaatr gtatgtgata 16560 
tggcttagaa aggcatgtag gtaaaaagga ctaaaaactc taataatggn tgggccaaaa 16620 
gtaaatttgt tagttctact ccattaagca ttcctcaagc agtgtaaaaa tcagagttca 16680 
agttacactt tgatgtgtag atcctttgaa agccactcta ccctgtttta tatgaagcat 16740 
ccgcagctaa aatgaacacc tagtgaagag tatgaatgct gcaatacata agcagacgtc 16800 
agaartgtcc caagctgatt ctaagttact ttaaacatgt atgcagag-c agaatatgac 16860 
ttacttctta gaagtaacag ataattacct ttggcataat gaaaaaaac* ttaaatgtaa 16920 
gttaatacag gtattttccc tttagcaaag ctttgctttt aaaagaaaac ttcaaaacti 16980 
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aaattaaaat 
agaaaaggaa 
agaaggaaag 
tattatttct 
taatctatgt 
tacattggat 
ttctatattt 
tggttaaatg 
tgcacattaa 
t ctgcagatt 
ttttctrgtt 
tatgaaatat 
tatatgcaaa 
ccagggaggt 
tcagtgaatt 
ttgtgtcaca 
gacatatggt 
caaactcacc 
ataacagtgg 
aagctaacca 
aagatatcaa 
gaattacatt 
aggagtttca 
tgcacacaac 
atctgcatgc 
ataaaaccaa 
tgatatcctg 
ggacat tagt 
ctatatatta 
accaaaagca 
gtaattctgt 
atgagaagaa 
taagcagatt 
tcattctgga 
acataaagaa 
ctaagctgaa 
agcccatgtc 
gttctaacta 
tccaagaaat 
cagtagactt 
gatataaata 
tttaagccat 
ggtggctaac 
ccaggaattc 
aaattagctg 
gagaatcacc 
ccaccctggg 
aaaaaaatca 
ccaaagacat 
aagtcagtaa 
attattattt 
caatcatggc 
cctgagtagc 
tagagacagg 
aagtgctagg 
agaatttatt 
atcattcaca 
catatactac 



aggaaatgct 
ggattctatg 
aaaagagaaa 
ttcaaatttt 
tcct cttatc 
ttccgggtct 
catgtcattt 
aagt tcaaaa 
ctcagccaca 
caactaacca 
atcattccct 
tataagtaat 
tactacacca 
cctggaacta 
caggattcac 
acatatacat 
ctactcaaat 
attccattga 
ttctctgaac 
ttgagaagta 
agtcagatga 
ttaatatacc 
agtatgcata 
aatacgtaac 
actgcaaagc 
aaaacaggca 
atatgaaatg 
ctttgtattt 
cctacttaaa 
actcrcatat 
tcttaacaga 
cagaaaaaaa 
ttcttacacc 
tgccgacatt 
accaatatcc 
gtttgcaact 
aaccaatgaa 
ttctaaggta 
tctaacatca 
acattttgta 
ctatcaaata 
ctcacattta 
acctgtagtc 
gagaccaacc 
cgcctggtgg 
agggcctggg 
tgacagagtg 
aaactgatca 
cttaaggaga 
ggtcaatttt 
ttttttgaga 
ttactgcaat 
tgggattaca 
gtttcaccac 
attacatgcg 
tgtggagaga 
atctatcttt 
atgcatgagc 



ctactatgra 
agggaggaaa 
aggaggaaag 
aaacgagcag 
tatgcttgga 
tcagctctga 
ctatttgcaa 
ataagtataa 
catctaacac 
tgggt cgaaa 
aactacagta 
ctacagataa 
ttttatatca 
atcacccaga 
attatttcac 
gcagacaggt 
acggtttcca 
t aagcgacct 
caatattgac 
catactgttg 
tacaactgaa 
ataagcaatc 
tgtcaatatc 
tgtacttata 
aaaagtataa 
tcacacacaa 
tcaaacaaaa 
ttaaattgat 
attattagca 
ttacccaaaa 
caggrgttgt 
aattagaagg 
atgaaattgt 
ctctatgatg 
aatagtaaag 
accaagaatg 
aaatgggagg 
taggctacct 
actgtaatct 
atattttctt 
attagctata 
acctaaactt 
ccagcacttt 
tgggcaacat 
tgtgcgcctg 
agatcaaagc 
agaccctgtc 
cttgaggtcc 
gatgaaatca 
tacatatatt 
cagagtcttg 
gtctgccttc 
ggtgtgcgtc 
gttaaaccat 
tgagccactg 
ggtaaagaaa 
caaaatgagg 
atgggaattg 



gtaaaaatac 
agtgggagaa 
aacacaagga 
aataaattct 
aaatttagac 
aaacaagctg 
atgttataaa 
catacattag 
agtcagccct 
atgtttttgt 
taacaactat 
tttaaagtat 
gactctcaaa 
ggtatcgaca 
aactagtata 
gactttcatg 
aatgtgtatc 
ctaccaacct 
cctcctttaa 
aagacagaac 
tgtttatgct 
tgcaaaagaa 
tgtatcaata 
tcatctcctt 
tataaaatcc 
gaactgaggc 
ttacccaggc 
tttttcttct 
aatagttatt 
gaaggaacca 
gtattctggc 
tagttttcac 
cagcagactc 
gaaagggact 
ttgaagaaat 
tattatgcca 
actgaaatca 
ctggcgtata 
gaggtccttt 
ctaagagctg 
gaacagctct 
ttatcaaatg 
gggaggccaa 
ggtgaaaccc 
tagtcccagc 
tgcagtgagc 
tcaaaaaaaa 
aacttatgtt 
taaaaaggtg 
aggctagcat 
ctctgttgcc 
caggttcaag 
accctgccca 
gagtttggcc 
cgtctggcct 
actcattttt 
tattaactat 
aagttatttt 



tttttagatt 
aaatgtaaag 
cagaaaggcc 
tttgttt tat 
aaaatgtt aa 
tttcttaaca 
gttcaatatg 
tttggctat t 
ccctatccag 
accaaacatg 
tttcacagtg 
acaagagggt 
catcagiaga 
gatggctata 
attttatgtt 
aaaagat tac 
caaccttgtt 
gcttat cccc 
attgatagcc 
atattct gta 
agattatatt 
gcaacttgcc 
tgtaatatca 
agcactaatt 
caaaaaacct 
gtatacttca 
tcaggttaga 
aatattcctt 
ttaaaagtat 
ctaccaagaa 
atgttacatg 
tatggaaata 
aataat cacc 
gaaagtaaaa 
aaacattctt 
gcagtaaatt 
atcattaaag 
ttatcagagt 
aaaaaataat 
tacattaaga 
attttcaaca 
tcaaaactga 
gatgggcgga 
catctctata 
tactagagag 
tgagatcgtg 
aaaaaaaaag 
tactatatct 
aggatgagaa 
aataaaaata 
caggctggag 
caatccttgt 
gctaattttt 
aggatggtct 
aaagtgtctt 
agtgaaataa 
tttggcttct 
attcctaagt 



actgaagcaa 
aaaaaaagca 
tatigaaata 
aactangaaa 
gagtaagtac 
tacgtcaat t 
atgtaaaaca 
ccaaat ttca 
gggttctgca 
t acaggct tt 
tgtacatgtg 
at gcataggt 
at t tggtaac 
tataaaccac 
gt t cacataa 
acccaagata 
taattataai 
tccaagcaat 
tttttttaaa 
aaatgctccc 
tctaagctga 
taaagatttc 
at ataatcaa 
attacaaaca 
tgaaaattt a 
ttaatgagta 
aat aaagata 
aatgataacc 
gagtaattag 
tcaaagccta 
aaaatcactr 
ggtaagtgat 
ctaaggggca 
t gcactaatg 
tggacaggaa 
aggaaactaa 
cagcagcaag 
tgacaattct 
ataaaccagg 
ttttatttgt 
gttataacat 
ggccgggtac 
tcacttgagc 
aaaaatacaa 
gctgagggag 
ccaetgcact 
aaagaaagaa 
acttatattc 
agaaaatagt 
tgagtgtctt 
tgcagtggtg 
gcctcagcct 
gtattttcag 
caaactccca 
attataacca 
ttaaaactgc 
aaaattaccc 
ttigagacttc 



17040 
17100 
17160 
1~220 
17280 
17340 
17400 
174 60 
17520 
17580 
17640 
17700 
1"760 
17820 
17880 
17940 
13000 
13060 
18120 
18180 
18240 
18300 
18360 
18420 
18480 
13540 
13600 
18660 
18720 
18780 
18840 
18900 
18960 
19020 
19080 
19140 
19200 
19260 
19320 
19380 
19440 
19500 
19560 
19620 
19680 
19740 
19800 
19860 
19920 
19980 
20040 
20100 
20160 
20220 
20280 
20340 
20400 
20460 
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atgttttaat gtgatcacta aaaatttcct aattgatgat taggaaaata actttctgta 20520 
aaattccaga attttagctg tttcaatctc tncatattaa ggggagaaca ttatgttttt 20580 
actttctgtg catgcacttt ctttattaga agaaaatgga ctgagggcag taagcaaccg 20640 
aaaaggaaga gtaataagaa gcctgatgtg tgtgaaaact ggagaacagt ctcaaatcat 20700 
aaaaagttat gacagaagag gcataaaaaa taaaagtaat gaacttaata tatgaaaggt 20760 
aataatgatt aagagcatag gctataaagc cagactggac tccctggatt caaatcctgg 20820 
ctcttctaat tactaggtag gtaaccctga gcaagtttca atgaccaatc tttttctcaa 20880 
ttacctcagg tatataaagg ggacagtaac agcatttaac ccagaggaca ataaggatta 20940 
aataaataca tgtaaaataa tttaaaacag tacctggtat tcaataaagc gcaataaatg 21000 
ttagctgcta ttattattca tctaaacttt actttcatta ccagcaatat tttttaatct 21060 
taaaaatatt gaataaaaca atgacctagc ttagtaaata aattcataat gagaaaatgr 21120 
tgatttcatt taataataac tttagtagtt tgggataaca ctttgcatat tttaatttcc 21180 
ccagctataa ataactcaaa taatttgcca tcagatgatc tgttattttg aagttaacaa 21240 
ataaagcatt tcctaaaaaa gttctaatac ataacttttg ctctcatctt atgttttaaa 21300 
aacaaaatgg caaatcatct gcatcaaata gttcctactc ttataacatg acaattgttt 21360 
taaaatatat ctgctggaaa aagcaactga agtcctagaa aatagaaatg taattttaaa 21420 
ctattccaat aaagctggag gaggaagggg aaaaacatat ctgccaaata agcttataat 21480 
taatagttgt tttcagtttt caaaaatcca cataggaagc aatttaagcc raaattgcct 21540 
aagtctcaat ctcagcgtag tagatagctt agggcaatca aaacttgctg tgttgggctg 21600 
ccccctacag gactcaattt acctatttct tttaaaaggt gtgtaagtag gaaatatgat 21660 
tcaagtttta cattaacaat attaatgcta aagcagatga ttatcattca cgcattcact 21720 
ataggaggaa acagtctctg agaaccatct atagagatac agagagaaat gaaacaatcc 21780 
ttgtccttga ggaattaata gtttactgct tacagagaaa ctacatacat ggrgaaatat 21840 
ttaaaaatag ctcatgatat cctctatgat attatgtttg ctatagaaaa agaacaaggc 21900 
tgaagatcta agatccaagt tctactgttg gctctgccat caaacaataa gctaaacaat 21960 
gtacaagtca gttttgggga agctgtctta ttcccaaaat gaggaggtta aattagttaa 22020 
ttcttccagc ctctatggct ctaatattcc acagttacat ttgtcaaaac aaaaggtaga 22080 
aggaaatgtt tcaaaaacag acttcgcaga aagaacatct atatgatatg aagggctggg 22140 
gcatatgtga agaaatcaag gaagacttct tgaggaaggt gacatctgaa gtaactttag 22200 
aagcactctg ggagccaagg ctattcccag gagttaacag agtcagataa taaaagatca 22260 
aagatgttta ggggaatagc atgcagtgtt atttggttgc agtctagcta tattttagga 22320 
aacatcaaat taatatcagt ataaaactca acagaatgga gggagaaaaa gcaggtagaa 22380 
aaatctaaga accactaaaa tagttcatct agaagataaa ggacccatga gctaaatcag 22440 
tgcaaatggc aagaagggaa taaatgaaga cagttctggt ccattagaac tgcaactcaa 22500 
-caaaagtgat caaaagagtt attccaaagt attgacctgg taacttgaag aaaagtaaag 22560 
aaagaggaaa ctggacactg aaacagaaga agtagattat gtatttggta gtgaatggaa 22620 
gtagattggt gggaccagtt agaacctcac agagaagaac tatgttaaga ccagaaatac 22680 
ggccaggtgc ggtggctcat gcctgtaatc ccagcacttt gggaggcctg ggtgggcgga 22740 
tcacctgagg tcaggagttc aagaccagcc tgacaaagat ggagaaaccc tgtctcccct 22800 
gtctgtacta atacaaaatt agccaggtgt ggtggtgcat gcctgtaatc ccagctactc 22860 
aggaggctga ggtaggagaa tcgcttgaac ccgggaggcg gaggttgcag tgagctgaga 22920 
tcgcaccatt gcactccagg ctgggcaaaa agagcgaaac tcttgtctca aaaaacaaac 22980 
aaacaaaaca aaacaaaaca cagaaataca tcaattaaaa aagtgagcta ttcaccagat 23040 
atgttccact ggtcataaaa caaaagaata caggaggcat gacaagccat catcattgct 23100 
gttaaaataa ctcacagcaa aattataatg atttaagtca ataacatcta ataattccag 23160 
ctatagtgtg caatttaatt tattatgtgc caggcacaat agtttattaa aggtattacc 23220 
tctaattttc acaataaccc tattttacag attataaaat ggaggcccag agatgtaagg 23280 
tgaacgagcc aaatcaccta gttacctgga atataaactc agaactgcct aaatcaaaag 23340 
ctctcaatct taaccacatg ctatactgat gcatgtcaaa gattcaatrc attcagattt 234 00 
ttcaaggtta tcggaaaacc tatgtagata aaaatttcca aaataatcaa ggatatgtaa 234 60 
cttttacaga aagcaatcac tgatcatcta ttgcaatact catgttctta agcaatatac 23520 
tgagttgaaa tttttatatt ttataaataa ttagaaagaa tacatttttt aaaactttaa 23580 
aaaacacctc agtttttatt ctcttcccca aatttcaaca aaatccattt atccaaactt 2364 0 
gaggttgaat cattaaagtg gtgatatcat cagtaatagc agagtgagga ccctgaatat 23700 
actctcctcc ataaaagcaa caagaacaca aaaattctca aaatgaactt tttctgaaat 23760 
ctttcaaaag ccccactctc agaaaactgt cattatttga tctgccagtt ccctagaaaa 23820 
acctccctca taggacatta tttgacttga ctcagagctc actcagtgca aacaatttta 23880 
tcaccaggag agtttgtgga aaatcagtgg caattgttaa acatcacatc tgccatgaga 23940 
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tagcaataac 
aagaaatcca 
cacatgtata 
tatgggaaac 
cgtatcattg 
tactctagtt 
ccaagcagta 
ggaaagaaac 
atctggtttc 
aaattacaaa 
gaaactggcc 
attttaaata 
agaacaatat 
tggtctagaa 
tactcaacac 
aaatagaaat 
ttgaaaagca 
agaatgaatc 
aaggaaggaa 
aatgagaggc 
ctaaacttcc 
aaaaagaata 
taaagagaga 
caaatttctc 
gaaagaagta 
gggtggccaa 
aaagaggctc 
tagtcccagc 
tgcagtgagc 
aaaaatgtca 
tgaagctctg 
ggaatgtaag 
ttgcactgtt 
cagaacagga 
aacttgaagg 
gcttaaggta 
ctaatctaac 
aaaaaacttt 
ttgggctacc 
atcttgcaac 
ccatccacca 
tctagcaggg 
ggctaaagac 
gaacactagt 
taacactcac 
ggtcagagaa 
ctgggagcaa 
catgaaggga 
ccttagaatt 
cgccagactt 
cccttctggg 
ggaagccaag 
ttgagatcat 
cttcccttct 
aaaattctcc 
tgagactttc 
tgcgccctta 
tttaggtata 



agatgggaca 
aagggggt ct 
gagctgtgta 
cctgaggctc 
aaggcaatgc 
ctaggcattc 
actttagggg 
taaacaagca 
cagagttatt 
gacatgcaaa 
ctgaaaaaga 
tgcgcaaaga 
ttctgatcct 
cttcttaaaa 
aatgttgtgt 
tatagagata 
caaaaactga 
agcaaatcta 
aggaggctca 
ccagaagaag 
cgaacttgac 
aaat caaagc 
ct ctcaaaac 
atcagaaatg 
gaatgtctgg 
ggtgggagga 
tgtctctaca 
tactcaggcg 
tatgactgtg 
accaaaaact 
aaggtgctta 
aaaattaaga 
ctggttattg 
tataaaatct 
agaaggaata 
aaacaaacag 
aaggaggggc 
caggagtttc 
ctctttgggt 
tgcactcttc 
ctgctgtttg 
tgtccgttgt 
ttgccattgt 
cactgggttc 
cgcgtggccc 
cacgaggctt 
ggaccccctg 
tctccaaagc 
ggaggaaaat 
tagactcagg 
ttgggaacct 
ggctgactag 
gtcgcagcca 
gtcccacacc 
ttacctctga 
atttcctcta 
ggcatctagg 
cagctctaga 



aacaagctaa 
gaaaagttct 
cacgctcaaa 
tgtacaagaa 
cccaacattc 
aagaaaatcr 
cctgtgtgat 
acagcaacaa 
ctgt tatact 
gaaacaagta 
ccagatgctg 
actaaaaaaa 
tcagaagaac 
acagaat cat 
gagatttatc 
aataggagtt 
attaacttga 
aagataggtc 
gagacccaag 
atgcagaaaa 
cccaaaaatt 
gatccacacc 
aggcaaggga 
atgttgtcaa 
gacctggaat 
tcacttgagg 
aagaataaaa 
gctaaggtgg 
ccactgcact 
acatgcagaa 
agactgtaga 
cagccttgtt 
tcaagctatg 
tatcaggtaa 
aggaaccaac 
ggaaataaaa 
ttaaactgat 
accagtccat 
cccctccctt 
tggtccgtgt 
ccgccatcgc 
gctcctgatc 
tcctacgcgg 
cacggttctc 
aagattccat 
gccatcatct 
gtaacaattt 
ggtaatattg 
actgggcacc 
tatgaggcta 
tggtctgcct 
aggcagaaag 
gaagtctcta 
tcctgggtcc 
atctacttcc 
gcaagttgta 
ctataaaccc 
catgggcagt 



ccaaaaaatt 
aacatat t tc 
aaacatctac 
gaaagtaaaa 
acacataggc 
ct tctaatca 
aaaaaat aaa 
caaaaacaga 
atataaaata 
taagccacaa 
gacttactgg 
agtttatcta 
cactttttgt 
agagtatatt 
catgttgttg 
acaaaaaagt 
ggggctcaac 
aattgcgaga 
agacaccatc 
agggtcagag 
aatctacaca 
t aggtacatc 
cttatgtaca 
taggcaatca 
gctggtggac 
caaggagttg 
agattggctg 
aaagatcgct 
cttgcagtgg 
aaactgcact 
tcaataccat 
tgataactac 
agcacaaacr 
agttaggcaa 
tcaaaccagg 
caactcagaa 
tattttacag 
aaactatttg 
tgtatgggag 
ttgttacggc 
aggcctgcca 
cagtgagacg 
ctaagtgccc 
ttctgtgacc 
ttattggaat 
tagaagcagc 
ggcgaccaca 
gaccactttt 
tgtcggccgg 
tctggggaag 
ggagccagct 
ctgtcgtccc 
ctcaacagtc 
caaccacgac 
tctgatccct 
tctccaaagg 
agggagtctt 
tatgtgggac 



aaaagaaaaa 
tgataatcca 
gaaggcccta 
tccagutana 
ccctggcaaa 
tcagatgatc 
aacctgaaag 
ccttgggaaa 
ttcaggtctc 
actgggggga 
acaaagact: 
aagaactaca 
cactacagst 
ctctttat at 
catgtatcar 
accaaacaaa 
agctgatttg 
aagagaggga 
aggcatacca 
tatctgaaaa 
tccaagaaga 
ataatcaaai 
aaacatcttc 
gatgacataa 
acctgtaatc 
aagaccagcc 
aatgtggtgg 
tgagcccagg 
agaccctgtc 
tcaagaaatg 
agaaaataat 
acataatact 
gatgactgaa 
gcaattacta 
cagcaatgaa 
cctaagcata 
cttgggtgca 
gttattagaa 
ctctgttttc 
tcgagctgag 
ctgacttcca 
cccattgccg 
gggttcatcc 
cgtggcttct 
ccatgaggcc 
ccgccaccat 
aagggacctg 
gcttgctact 
ttaaaaacga 
ggctttctaa 
tccactttca 
gaactcccgg 
gcccatgcgt 
tttcttgaaa 
gcctcctagg 
gatct aagga 
gtccctggtg 
ctgttcccca 



cctgggaaa* 
gaaagccata 
aactctcac: 
aattgctcgc 
gattggaaga 
actaaacrca 
aattagttca 
ggggggaagc 
aacaacaaca 
aaaagcagcs 
taagagagt" 
ggaaagtat c 
tagttctgtc 
cagctcttt- 
tcccaaacag 
aattctggag 
ggcagccaca 
agaaggaagg 
atatacatai 
aataatggcc 
taaacaaac: 
gactgaaata 
agattaataa 
tcaaagcacr 
tcagtattt t 
tgggcagcag 
tgtggacctg 
agttggaggc 
tctataaaga 
atcagtacct 
ttagtattta 
gtaactgttc 
atacagaata 
gttgtaattc 
ttgtaaaaaa 
tcgtaagaac 
attatcccac 
aatagcttta 
actctattaa 
ctttcactct 
tccctctgga 
atcccgactg 
taattgagct 
aatagagcta 
aagaacccca 
cttcggagtt 
aacccgcaac 
ctggcctatc 
ttagcatggc 
caaccctcaa 
attttcctgg 
cattagccgg 
gcgctcctac 
gtgtagcccc 
tactaatggt 
agctctatgc 
tccctcctga 
ccacccttgc 



24000 
24060 
24120 
24180 
24240 
24300 
24360 
24420 
24480 
24540 
24600 
24660 
24720 
24780 
24840 
24900 
24 960 
25020 
25080 
25140 
25200 
25260 
25320 
25380 
25440 
25500 
25560 
25620 
25680 
25740 
25800 
25860 
25920 
25980 
26040 
26100 
26160 
26220 
26280 
26340 
26400 
26460 
26520 
26580 
26640 
26700 
26760 
26820 
26880 
26940 
27000 
27060 
27120 
27180 
27240 
27300 
27360 
27420 
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cagggcccca agtttgtaaa tggctaagag aggaaacaga gagagacaga gagaaagaga 27480 

cagtgagaga cagacagaga cagagagaga gagagacaga gaggagagag agagagacag 27540 

ggaggacagg gagagagaca gagaggagag ggagagagac aaagaggaga aagaggcaga 27 600 

gagacaaaca gggagtcaga gaaagaaaga caaagataga aatagtaaaa aaaaacagtg 27660 

tgccctattc ctttaaaagc cagggtaaat gtaaaaccta taattgataa ttgaaggtcu 27720 

tctccgcgac cctataacac tccaatacta ccttgttgtc agcgtaaaca agggcgragc 27780 

ctgaaaacac taagaccact gacaacccat agccttccta tcaaaaatcc ttaacatcca 27840 

gtgacctgcg gatggcccaa atgcattcaa tctgtagcgg caactgctti gctaacagaa 27900 

aaaagtagaa aagtaacttt tagaggaaac ctcattgtga gcacacctca ccggttcaga 27960 

attattctaa gtcaaaaaag caaaaaggta gcttattaac tcaaaaatat taaagtacgg 28020 

ggctattctg tcagaaaaag gtaatttaac actaaccact gataattccc ttaaccctgc 28080 

agatttcctt acaggggatt taaatcttaa ttaccataca aaggtccgac cagacctagg 28140 

aggaactccc ttcaggacag gargatagat ggrtcctccc aaatgactga ggaaaaaacc 28200 

acaatgggta ttcagtaatt gatagggaga ctcttgtgga agcagagtta gaaaaattgc 28260 

ctaataattg gtctcctcaa atgtcagagc tgtttgcact cagccaagcc ttaacgiact 28320 

taccgaatca aaaagactat ctcaatcctg actcaaaagc ttacttatac ccuctctgaa 28380 

acgaatttgc ctaagaactg ttgtttatgg gaatgcatct tgatggagca gctgggttgt 28440 

tatgaaatac tcaggaactc agcctagctc taggactcac ccctgagcac aaaggcaatg 28500 

ttgggcacgc tggtaaagga ccactagaat ccagcagccc ggaccccttt ctttgtgatc 28560 

aagaaaggcg ggaaaagggg tgagggctgc tacatcagtg agcataacra atccgataag 28620 

cagaggtcca tgggtggtta cacaccccgg aaaggaataa gcattaggac catagaggac 28680 

gctctaggac taatgctcat cggaaaatga ctagtggtgc tggcatcccr atgttctttt 28740 

ttcagatagg aaacgttccc ctcaaggcaa aaacacccct aagatgtatt ctggagaatt 28800 

gggaccaatt tgactctcag atgctaagaa aaaaaagaca tattcttctg cagtaccgcc 28860 

tggcaacgat atactcttta agggggagaa acctggcatc ctgagggaag cataaattat 28920 

aacaccatct tacagctaga cctcttttgt agaaaagaag gcaaatggtg tgaagtgtca 28980 

tacgtacaaa ctttcttttc attaagagac aactcgcaat tatgtaaaaa gtgtgattta 29040 

tgccctacag gaagccctca gagtctacct ccctacccca gcatccccca gactccttcc 29100 

ccaaataata aggacccccc ttcaacccaa acggtccaaa aggagataga caaaggggta 29160 

aacaactaac caaagaatgc caatattccc cgattatgcc ccctccaagc ggtgggagga 29220 

gaattcggcc cagccagagt gcacgtacct ttttctctct cagactttaa attaaaatag 29280 

acctaggtaa attctcagat aaccctaatg gctatattga tgttttacaa ggtttaggac 29340 

aatcctttga tctgatatgg agagatataa tgttactgct aaatcagaca ctaaccccaa 29400 

atgacagaag tgtcgccgta actgcagcct gagagtttgg cgatctctgg tatctcagtc 29460 

aggtcaatga taggtcgaca acagaggaaa gagaacgatt ccccacaggc cagcaggcag 29520 

ttcccagtgt agaccctcac tgggacacag aatcagaaca tggagattgg tgccgcagac 29580 

atttgctaac ttgcgtgcta gaaggactaa ggaaaactag aaagaagcct gtgagttatt 29640 

caatgatgtc cactataaca cagggaaagg aagaaaatcc taccgccttr ctggagtgac 29700 

taacggaggc attgaggaag catacctctc tctgtcaact gactctactg aaggccaact 29760 

aatcttaaag gataagttta tcactcagtc agctacagac attaggaaaa aacttcaaaa 29820 

gtctgcctta ggcccggaac aaaacttaga aaccctattg aacttggcaa cctcagtttt 29880 

ttataataga gatcaggatg agcaggcaga atgggacaaa tgggataaaa aaaaggccac 29940 

cgctttagtc atggccctca ggcaagcgga ctttggaggc actggaaaag ggaaaagcta 30000 

ggcaaatcaa atgcctaata gggtttgctt ccagtgcggt ctacaaggac actttaaaaa 30060 

agattgtcca aatagaaata agccgccccc tcgtccatgc acctcgtgtc aagggaatca 30120 

ctgtaaggcc cactgcccca ggggacgtag gtcctctgag tcagaagcca ctaaccagat 30180 

gatccagcag caggactgag agtgcccggg gcaagcacca gcccatgcca tcaccctcac 30240 

agagccctgg gtatgcttga ccattgacgg ccaggaggct aactgtctcc tggacactgg 30300 

tgtggccttc tcagtcttat tttcctgtcc cagacaacgg tcctccagag ctgtcactat 30360 

ccaaggggtc ctaggacagc cagtcactag atacttctcc cagccactaa gttgtgactg 30420 

gggaacttca ctcttttcac atgcttttct aattatgcct gaaagcccaa ctcccttgtt 30480 

agggagagac attctagcaa aagcaggggc cattatacac ctgaacatag gagaacaccc 30540 

gtttgttgtc ccctgcttga ggaaggaatt aatcttgaag actgggcaac agaaggacaa 30600 

tatggacgag caaagaatgc ccgtcctgtt caagttaaac taaaggattc tgcctccttt 30660 

ccccaccaaa ggcagtaccc ccttagaccc gaggctcaac aaggactcca aaagattaag 30720 

gacctaaaag cccaaggcct agtaaaagca tgcaatagcc cctacaataa tccaacttta 30780 

ggagtacaga aacccagtgg acagtggagg ttagtgcaag atctcaggat tatcaatgag 30840 

gtcactgtcc ctctatacct agctgtacct aacccttata ttctgctttc ccaaatacca 30900 
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gaggaagcag 
catccrgact 
acctggactg 
gcccaagact 
ttttactttt 
attttctcgc 
aggttaaata 
gcttatcctc 
tgccaaatat 
gaaactcaga 
caggccctaa 
ttttctttac 
tgagcttgca 
ctcattgttt 
tacaaggaag 
agacttgtgg 
ctcccttat c 
cctccatgct 
cttcccagaa 
actgcccaca 
aatactcatt 
actgtctgtc 
caggcaagag 
cctagcccct 
tgcctggtaa 
cctactaact 
cctgaacaat 
cttgtttcca 
actgtagaca 
tgcctaccct 
tcttcagaat 
aagatttata 
ttgttatcgg 
ctactcagtt 
actccctggt 
gaagagcttt 
aatgttgtta 
ttgtcacaga 
aaaaacacca 
ggatctctag 
gttaagtttg 
ccccagatga 
tgctccaatt 
ctactatgcc 
gcacttgggt 
gccgactaag 
gcttgcaact 
attagacaaa 
gaaggacaat 
ggtcccctcc 
aaaaaaaaaa 
atacagttca 
gcatttccat 
tacaccctcc 
tattagtttt 
tattggttct 
tattcctttt 
ttacctgttg 



agtggtttac 
ctcaattctt 
tttcacccca 
tgagccggtt 
agccgccagt 
tacctgtggc 
cttagggcta 
atcccaaaac 
ggattcccag 
aagccaatac 
agaaggccct 
atgtcacaga 
acccatggca 
atgggtagtg 
agatctgtgt 
ctgtcagaca 
atatttttct 
gctgtacaac 
atattgatgc 
cccatatgcc 
attggacagg 
ggacttactt 
aaaaacatgt 
acaaaggact 
gcctatttaa 
gttggatgtg 
ggaacaacta 
atctggaaat 
caaccaactc 
caggaatatt 
ctatgtgctt 
caattatgtt 
agcaggagtg 
ctactacaaa 
caccttgcaa 
agacttgcta 
ttatgttatt 
gaaagttgaa 
gaccctgggg 
cagctctaat 
tctcttccag 
agtccatgac 
gtaatgatat 
ccaattccgc 
tttcctgttg 
aatcccaaag 
tagctcacac 
aacaggaggt 
gatcgggata 
ctttgtatgg 
tagcttaatt 
aactgtaaca 
catgccctaa 
tgacctggcc 
gtctgttcta 
ttttactcaa 
aatcctgaat 
acagatatct 



agacctggac 
atttgcctt t 
agggttcagg 
ctcauacctg 
tcagaaacct 
tacaaggttt 
aaattatcca 
cctaaagcaa 
gtacggcgaa 
ccatt tagta 
aacccaagcc 
aaaaaacaga 
tacctgagta 
gcggcagtag 
agacatctca 
accgtgagga 
ctttactgtt 
cagcagctcc 
cccatcaaat 
ccacaactgc 
gaaaatgatt 
cacccatact 
aaaggaagta 
agatctctta 
taccaccctc 
cctccccctg 
cagcacagaa 
aacccatacc 
ccaatgcatc 
ttttgtctgt 
cct ctcattc 
gtacctaagc 
ctaggtggac 
ctatctcaag 
gatcaactta 
acctctgaaa 
ttagcggaag 
gaaattcgag 
cctcctcagc 
attgatactc 
aatcaaagtt 
taagatctac 
cgaacgcacc 
aggaagcagt 
agtgggggga 
cctagctggg 
ccgaccaatc 
aaaaaaatag 
taaacccagg 
gagctctctc 
gaagaataaa 
gtgttacagt 
aagttccttc 
cagaccttgg 
gaacttctta 
tgtaatgttc 
agtatgctgt 
gagctattat 



cttaaggatg 
gaagatcct t 
gatagccccc 
ggcactcttg 
tgtgccatca 
ccaaaccaaa 
aaggcaccag 
ctaagaggat 
atagccagac 
agatggacac 
ccagtgttta 
.aatagctcta 
aggaaattga 
cagtcttagt 
taacgtgaac 
aagtaactaa 
ctcttacccc 
cct taccaag 
aggagtt tac 
tat aactctg 
aatcctagtt 
ggtatgtctg 
acctcccaac 
aaactacatg 
actgggctcc 
tatttcaggc 
ataaacacca 
tcaaacctca 
aggtgggtaa 
ggtaccttag 
ttagtgcccc 
cccacaacaa 
taggttctgg 
aactcaatgg 
acttcctagc 
gagggggaag 
aatgttgtta 
attgaataca 
caatggatgc 
ctctttggac 
gtaaagctac 
cgt ggacccc 
cctcccgagg 
tagactggtc 
ctgagagaca 
aaggtgacca 
aggtagtaaa 
ccaatcatct 
cattcaagcc 
tgtcttcact 
ttaatacaat 
ttcaagagga 
ttgtccctta 
cctcagaaga 
aaaacagaat 
tgtgacattt 
tttaggaata 
gatggatatt 



cetttttctg 
caaacccaat 
atctatttgg 
tcctt tggta 
agtcacccaa 
ggctcagctc 
ggccct cagt 
tccttgacat 
cattatatac 
ct gaagcaga 
gcttgccaac 
ggagt cctta 
tgtagtggca 
atctgaagca 
ggcatactca 
aatcgtaaat 
cct tcactct 
agttt ctatg 
ct aaaggaaa 
ccactctttg 
gtcctggaag 
aggggggtgg 
tgacccgggr 
aaaccctcca 
atgaggtctc 
catgcatttc 
cttccgtttt 
cctgtgtaaa 
ctcct cccac 
cctat cgttg 
catgaccatt 
aagagtactc 
cattggcggt 
tgacatggaa 
arcagtagtc 
ctgtttattt 
ttatgttaat 
acgtagaaca 
cctggattct 
cctgtatctt 
aaatcgttct 
tggaccggcc 
aaatctcaac 
gtcagccaac 
ggattagctg 
catccacctt 
gagagctcac 
atcgcctgag 
ggcaacggct 
ctattaaata 
aaaaggaata 
ccccttcaac 
ctggttgggt 
atcatttttt 
catagagtat 
atccatatta 
taatgcaatt 
atgaataat t 



cat ccctgta 
gtctcaactc 
ccaggcaita 
tgtggatgat 
gtgctcttaa 
tgctcacagc 
gcctat tctg 
aacaggtttc 
actaat taag 
agcggctt tc 
ggggcaagac 
cacaggtcga 
aagggttggc 
gttaaaataa 
crgctaaagg 
ccccatggcc 
cactgcaccc 
aagaatgcgg 
ctccaccttc 
catgcatgca 
acttggagcc 
agttcaagat 
acatagcacc 
tacccatact 
ggcccaaaac 
aatccctgr a 
agt aggacct 
atttagcaat 
acgaatagtc 
tttgaatggc 
tacactgaac 
attcttcctt 
accacaacct 
tgggttgccg 
cttcaaaatt 
ttaggggaag 
caatccrgaa 
gaggagcttc 
ccccttctta 
taacctcctt 
tcaaatggaa 
tactagccca 
tgcacaaccc 
ctccccaaca 
gatttcctag 
taaacactgg 
taaaatgcta 
agcacagcgg 
accttctttg 
ttgcaactgc 
cattttaagr 
aagatattgg 
ccatctctac 
tgtcactaca 
gttctctttg 
ttgcatgtat 
gtttattcat 
ct gctatgaa 
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32640 
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32940 
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33060 
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33240 
33300 
33360 
33420 
33480 
33540 
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34140 
34200 
34260 
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cacttctgta caatgttttc tcggacatat 
aactgttgga tcagaaagta agcatatgtt 
ctaaagtgat ttgtaccatt ttacactcct 
cacagccttt ttactacttt gttaatcttt 
atctagggaa cgtgaagtag tatctcactg 
tcgtgtatct tttcatgtgc ttattagcca 
aaatttgtaa ctaaaggtgc tttcctgagt 
aataaactac agtcttggaa tgaaaaatta 
gttttactct gtgtatgtct ggtttgctta 
cacagtgctt atttcactaa tgagtatcac 
tgaactcaat aaatatgtta atgtgtatgc 
atacacacat ataaacatat attaattttt 
gagcctctgg tttgaagaat tctcaaatta 
cactgtacct gaaatagccc tactgttcta 
aaataattaa gattccaact aattttaaaa 
tacataaaaa gaaaatttta aataaaagca 
gggctgtatt tctttaatcc tttaaaattc 
ttaactgaac caaactatgc ccatgaaaga 
acatattcat cttcttgcaa aaaagatatt 
attttgaggc agatttgtac tttagtcctt 
gtctggtcat tgacctccaa cttaaaaaat 
ttatgaaagt caaacaaggt agcataaagg 
agattttaaa aatcactcta catcccataa 
agaaaataac aattattgcc taattgaaaa 
atgaacatta tagtacatca tattacgagc 
aggatttcct tagtttgttc atatagttta 
gcattgtgag gagcataaag acataagcac 
taaagaagac ttcttcttgg gtatttaatc 
attaacttca tagactgacc ttagattact 
tctttaacat accagtattt atcttataac 
ccttttaagc actaagcatc cattctatac 
atatttttaa aacttttatt tacttttatt 
aggctggagt acagtggcat gatcttggct 
ttcaagtgaa caaatcatac ttttaagcac 
tgccataact agggtgtgaa ttaagtatta 
atatatctct aaatgaaaaa gaacatatta 
taacccatcc ctctctcccc tttcctccaa 
ctgagctaag cagctcctgg ggttggggaa 
cagtgttttc ctctctggga ggaactagca 
gctgaatcct ttctattcct gaggcagaca 
accaagagcc ctgccaggta ttgatacctt 
tacaaatgct aaataagtat ctttgaaata 
aaaatgggta gtatttttta ataacctgat 
ttatggaatg aaaacacaga ggtaccaaat 
aacccaataa cttcatcaaa ctagcaaata 
gaaggaaatc acttagatct gataaagact 
aactgtatca attaatacca gaaaacaaac 
cagcacagtc ttggtaatgc aatactataa 
gtttgtaaaa acacaatagg atgagatttt 
tggaaacaaa ataaagaaaa acaaaatcta 
tctatttgaa gaaaacctta aaatctatgc 
aatatcatgt tcttgtctgg gaagacttaa 
taaatcgaaa tttaatgtat ttccatctct 
aagtgatttt aaaagtcatg gaaaattaat 
aaggagacaa atgaattgct ccaacagata 
ctaggataag aaaatacata tactgatgta 
taagtcaaac tactttacta taaaccaggg 
gtaagaagtg agtaaactat ggcccactgg 
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attttcattt ttctrgagtg gagctgttag 34440 
gaattttgaa agaaactggt aaacr cttg- 34500 
actaataatg tatgagagtt atatttgczc 34560 
ttagtactgt caaccrtttt aatttaicca 34620 
ttattttcat tttcctgatg agtaacaata 34680 
ttcctatatc ttttgtgaaa tagttaac" 34740 
ttcaggtagt aagcctattt ccct caa gtg 34500 
aacacagtgg agacattttt tgtataag^t 34860 
gtctattatt atatgcccca tgaaagcaaa 34920 
tagcacatag aactgtgctt gcccaaagca 34980 
atgcacatac atctacatgc atgtacatct 35040 
agacccacaa atctaagaaa actaattct: 35100 
ttaacatatc tttatgttcc actccaca:: 35160 
ctttggtaaa tcaggcaaat ttaattttrt 35220 
tataatttga aagttaacaa tgaaataca: 35280 
aaactaaacc caataagagg aaagaaagtt 35340 
aaatcacaca atgctccaat gaaat ct~ ca 35400 
tctcatatgc aactgctaaa acctcaataa 35460 
tctttataat atgcacatgc agtatatacr 35520 
gttccattgc ttaccggctg gctgtccttt 35580 
aatacttgcc ttgtctaccc cacagaagcg 35640 
tattttacaa gatataaagt gctataatac 35700 
tactttgttg tacaatttta gagcaatag- 35760 
tccagtcccg aattccataa aatgtatgat 35820 
cccaaataat cactgcttat atagttggtt 35880 
tatatttatg cagtccctat tttgtgagag 35940 
agtacagagc cttagcttct ctacatttac 36000 
aatatttaaa gtattctggg aagaaatgaa 36060 
atcattacaa aaagatgcct gagtgatctg 36120 
tgttatattt acttgaatca gaagtgaact 36180 
tttcttgtct ttacatatga gatacaaatc 36240 
ttttagagac ggagtcttgc tctgtagccc 36300 
caccacaatc tccacctcca cttcccaggg 36360 
agattctcaa catgtatcct agcatgctac 36420 
aagacagctt accccaaata ttactgtaac 36480 
acaactatac ttggatggga ttctgggagc 36540 
attccatctc ctattaacac accagctctc 36600 
gggtgtacat ggagaaagct agaacctcta 36660 
ggcatacgaa cagaaaaagc tgaataaaag 36720 
gagagaagac cagggaacaa agagacttcg 36780 
tgatactgag aaaatatctg ggatatgaaa 36840 
ggggtaaaag aataaagggt cttgatgagr 36900 
aatgagcttt aggaaaaggg aaggtcaacg 36960 
ttaaaagcat aaaaaaaagt ggaggggggg 37020 
acttagtatc atttctaatt agaaacgcta 37080 
aggctataat tctaactgat gaaacactta 37140 
acagaaaagt ctactagaac catcattati 37200 
tagcaatgca ataaagcaag aaaaaaaaaa 37260 
tgtttttcca atgccataaa taactagaaa 37320 
caaaacacct ggaaataaaa agaaaaatgg 37380 
agaacataaa acaaaatctg aataaaaaga 37440 
tatcataaga aagtgaatta tatcaaaatt 37500 
aatcagacag gacactatgg ggaactgaat 37560 
aactgagaat aaccatgaaa agtatgaaaa 37620 
tcagaacgct aaaattaaat aaaaatacta 37680 
atgaataaag aatccagaat tagattccag 37740 
gtggcatatt catccagtgg gaaaaggaca 37800 
ccaaattgtg gcctctgcct atttttgcaa 37860 
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ataaagtttt 
atgttacaga 
actatctggc 
tctcatagac 
acggggtctt 
cctcaacctc 
tgtgtgccac 
taagaaaaag 
tcaagatgaa 
taaaaattat 
ataaaattat 
gcaatttaca 
ctaagtgtga 
aaaaatcaga 
atatactgtt 
ttttaatctc 
aaaaatacat 
cttgatagtg 
taaaaaagaa 
aggccaaagc 
aaaaccctgg 
tcccagctac 
agtgagccaa 
acaaaaagaa 
aatgggcaaa 
tgcagagcac 
acagaaaata 
gggaatgtaa 
aaataaaatt 
aacagggtgt 
atatttgttc 
atttaaattg 
ctactcagtt 
gcaacagact 
accctggctt 
caaaaccagg 
ctaccaccac 
ggcagcatta 
aaaatgtggt 
ctatctatat 
ttcaccatgt 
cttcccaaag 
ctgacacata 
tcacaaaaag 
cataaagtag 
agaaaagagt 
tggttaagat 
ataatattaa 
cattcacctg 
ttattacaaa 
aatattcagt 
gttattgcaa 
atcaacatcg 
catatttcta 
gagtctaaaa 
agtttccatt 
atttttagca 
aaagaattaa 



actgggacaa 
atcacacagt 
ccttgaagaa 
acctatctca 
gctctgttga 
ccaggttcaa 
tacgcctggc 
aagggcatat 
ttatacagtt 
tttataaaat 
tttataaaat 
gaaaaccaag 
gagaattatt 
gttataatgc 
agtgaaaatt 
taccttttga 
atgcttactg 
aatact gaac 
taaattaggc 
aggcggatca 
ctctacaaaa 
tcaggaggct 
gatcatgcca 
caaattaaac 
ggacttgaat 
tattcattag 
ataaatattg 
agtggtacag 
atcttatgat 
acacccattt 
aaatattctt 
gtggattctg 
gaaggtctta 
gcctttggac 
ggtgagtcca 
aaagccaatt 
caccatgatg 
ttcacaatag 
atgtatatac 
ctatacacac 
tgtcaaggct 
tgctgagatt 
atacaatata 
gcaattagtg 
aatggggaaa 
tttggagaat 
tataaatttt 
ggaaaaatac 
ggaaacagaa 
tgatgttgtg 
ttactaacca 
gatatctact 
ctaaaaccct 
ctgtcctcac 
tttggctcct 
ttcaaaaatg 
catagaagtt 
aatattaatg 



agccaagcct 
ttcaacagag 
agtttgccaa 
cacaacacat 
ccaggctgga 
gtaatgcrcc 
taaggggcct 
ttgatatata 
atat tttgca 
atctttaata 
aaaaagttaa 
tccaaatggt 
agttaaagta 
cctattgctg 
taaactaata 
tgcaaaaact 
tagtactgtt 
aaattacagt 
tgggtgcggt 
cttgaggcca 
aatacaaaaa 
gaggcaggag 
cagcattcca 
cctacaactc 
agacatttct 
tgattacatc 
gtgaagatct 
ctactacgga 
aggaatatgc 
caacatttac 
ctggatgctt 
agtacagcag 
cagaaaaaga 
tcaactgcaa 
gggtctgatg 
cattaaaata 
gttctgtttc 
ccaaaaggtg 
aatggaatat 
atactcacac 
ggtctcgaac 
acatgtgtga 
gataaacaat 
tatgattcct 
cagagagttg 
gaatgtacaa 
atgttacatt 
tataaataac 
tacatcctat 
tatctttttg 
gtaagtcctt 
aaaatggaaa 
ggaggggaag 
ttttcaaaat 
tcttcagttt 
tactttttct 
aaatagattt 
gcgctttaat 



atcatttgca 
accatcttgt 
accttagttt 
tgtgggaaag 
ctgtagtggc 
caccacagaa 
ttttaacaga 
tttatatttt 
atgtgtttga 
tatttataga 
gaagaaaaga 
caacaaagat 
aaaatatct c 
gtggagatgt 
catttttgaa 
catttttggg 
tataatggta 
gcatctacag 
ggctcatgcc 
ggagttcgag 
tuagtcgggc 
aatcacttga 
gtccaggtga 
atcaacaaaa 
tcaaggatga 
ccacatgcat 
gaaaaacaga 
aaacagtatg 
atttctgggt 
atgtcaattc 
ctatatatat 
attaccatcc 
ctgacctccc 
ctcttcct tg 
aggtaggctg 
aatctctctc 
tctggagaat 
gaagcaact c 
tattaagcct 
acacacacac 
tcctgggctc 
gccaccacac 
gaggacatca 
cttgtatgag 
tttaatgggt 
cagtgtgaac 
tattttacca 
aacaacaaaa 
tctgctagag 
aaatgactga 
ctttcatggt 
acaactgaaa 
aatcctaaca 
ccagaaatca 
agaaggtgcc 
ctccccaaac 
gcttaaccaa 
gatacaaatg 



aattgt ct a z 
ctacaaagct 
atataa taaa 
gaccttcttr 
atgatcatgg 
tcccaaacag 
gaaagaaatc 
ttatatagat 
cggtaaaagt 
tattataata 
taggcaaaac 
aaaacagatt 
tctataccca 
aaggggagaa 
aagtaagctg 
tacctattcc 
aaaactagaa 
attaaacata 
cgtaatccca 
accagcctgg 
atggtggtgg 
gcctgggaga 
cagaacgaga 
atacccaaac 
taaacaagca 
taggatggct 
aacctt tgtg 
gccattcctc 
aaatacccca 
aactgggcca 
gttttttggc 
acaatgtagg 
ttgagcaaga 
agtcaacagc 
cagactcaag 
tacacaaaca 
gctaatacac 
cagcagatga 
ttaaaaagtg 
acatttatag 
aagcaaaccg 
ccagccaaaa 
tgatatgcga 
gtacctatgg 
atagagtttg 
ataattaaca 
tgattaaaaa 
aaaacacct c 
atatatctgc 
aaaactaaat 
tcctgacttt 
aggcaaaatt 
aacatggcca 
acatttctgg 
aagttaatcc 
cggtatctag 
aatagccagt 
aacaacttta 



aaatattttc 
gaaaatatci 
aga tcagcta 
tttttn tgag 
ctcactgcag 
ctgggagaga 
cacatactac 
atcataaaaa 
ttaatatcta 
taaaat atct 
aaaatacagu 
taraaactca 
caatactact 
gcargctctc 
gcaatttttt 
ataccttaaa 
aaaaagaaaa 
atgcagccar 
gcactttggg 
ccaacatggc 
gcacctgtag 
cagagattgc 
ctctgtctca 
ccaattcaaa 
catgaaaaga 
agtatgaaga 
cactgttggt 
aagaaaataa 
aataactgaa 
gaatacccag 
tgaggttaac 
tgggcctcat 
aagaat tcag 
ccat cccatc 
gaagagctgc 
cacacacaca 
ccctgttcat 
atggagaagc 
gaaattatat 
aagacagggt 
cctgcctcag 
aaaggacatt 
aataagcctg 
atgtcaaatc 
ttttgcaaga 
ctactgaaaa 
t taaaacaaa 
aagcaactta 
agttcaaaat 
taaaagcaat 
tctgtaagat 
ataatttctt 
taatttgcca 
aaacaaaaca 
ctgacatcct 
attcttaaat 
aaacctccca 
cattcaatcg 
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tcaatgggaa aggaagcaga attctgagga ttatgaaagt aaacaaaacg aagttcaaa: 4I4GC 
tctactttat tttacttttt tgtaactaat gaacaacttc ttccaaagac aagtaggaaa 4146C 
tacaaaaatt agccaggcat ggcacatgcc tgtagtcctg gttacttgga aggctgaag- 4 152C 
gggtggatcg cttgagccgg gaaggcagag gctgtagrga gctgagatca catcac:gc= 4 1 5 3 C 
ctcaagcctg ggtgacagag caagaccctc tctggggaaa aaaaaaaaaa aaataggctg 4 164C 
ggcgcagtgg ctcacacttg taattccagc actttgggag gctgaggcag gtggtzcacc 4170C 
tgaggtcagg agttctagac cagcctgacc aatatggtga aaccctgtct cuacraaaaa 41760 
tacaaaaatt agccaggcat ggtggtgggc aattgtaatc ctagctactc gggaggctga 41S2C 
ggcaggaaaa tcgcctgaac ccaagaggcg gaggtttcag tgagccgaga ttgcactag- 41880 
gcactccagc ctgggcgaca gagcaagact tcatctcaaa ataaataaat aagtaagtaa 41940 
ataaaattaa aaaatatata aaaataaaac aaagataagt aggaaccatc cttttttttt 42000 
tttttttttt ttttttttaa agatagggtc tgtttctgat gcccaggctt gagcgtagtg 42060 
gcatgatcat ggctcactgc aaccttgacc tctcaaatac aagtgactct cctacczcac 42120 
cctcccaagt agctgggact acaggtgctt accaccccat ccggctcatt taaaaaaat: 42180 
tttttgtaga ggtggggtct cactatgttg tatccaggct ggtctcattt taactitat: 42240 
agaaaacaag cattgtttta tcagcttctt gtttttttaa aactaaaaat aacactgcta 42300 
ggttgtttct atgaagattc tctaaattta tttataacct taagaataac atgtagaaca 42360 
aagtagatga ctgaatgatc tttgttgaat aaatatgaat ggatattcaa ataatiaaaa 42420 
atctcttaag atctcccatt ctttacagga tacagagaaa actcgttaat atggcctgac 42480 
ttttaccttt gcagccttat ccaaactctg tggtcaagac aaacaggttg tccttatac" 42540 
tacaacgtcc ccctttgcct acaaagctct tctcatgact ctttgcctat cttaagitca 42600 
cctatctgtc aaatctctgg gaatgcaaca tttcctcaag gtagccttct ctcctcccaa 42660 
actagaacaa attcttcctg gggcattagg tttttattgc actgtatgtc tcttcttcac 42720 
agcaatcaca gttccaatgt tatatttgta ttcttagttg atttgtttct ttccaccttt 42780 
agactataac cttctaaggg gtcacacata atatcgatca tcagttgtat cccttgrgca 42840 
tagcacaggg catggcaggc aaatatgtgt gtaaataaac ttgttgaatg aatcaatgag 42900 
acacactttt cttacccaaa gtataatggc aggataacat ttatcaatct attgcttctt 42960 
gaaaaacaga tatgatgtgc ttaattttca ttttacatct caaataccaa tgcctaagga 43020 
attcacagtc attttacaaa tctttttgac aaatgccttc attaatcacc acctgtttac 43080 
aagtgctaaa taacattttg gttacattct gtaacatttc ctgcacttaa tgtcatctct 43140 
agaatactgg ctaatatgaa gcacctggac ttcaggaaca caaacctgaa actaacacac 43200 
caaactaaac tgttatgtaa atgacagaaa tgacacattt tggtctgcaa catctctaga 43260 
tggcttttgg accaattcaa cttttaccac taaaaatcgg tcacctgact atagtcattt 43320 
tgagctcatg ataaatgaat tacagatgaa aaataaatag tttgatgaca atctttacaa 43380 
aagtttatct tcaaagaata ccaccagtca caggtattct aggctcctan caacttattt 43440 
ggtcagggca gacttcactt ttcatgataa ttatgttctg aaaattctac aaacttaatg 43500 
attacaaaca aaagtcatag tttgctcata aatcaggcct aggtctggat tctagttctt 43560 
ccatttttca tttgttcact gaggcaagtg acttaaaatt ccctagccrc agtttcctca 43620 
catgtaaaat cagataatga ttcctattcc taagatggtt ttgaggcttc aacaagataa 43680 
gatgggcctc actcaagcat gctcagtact ctgtctctct ctctccggtt atgcagaaat 43740 
tctattagga ttctgcaaag taaaataaat atttcagtaa aaattatgcc ctttattaat 43800 
gaatctagat tttcagattt tccttaaatt tacttagtaa cttaagggct caaatattat 43860 
agagatttgt atctagtatt ttaaagaaat gaaaggtgtt aatcaaaatg ctgcacaaat 43920 
aaatgctaca tttaacaaac agaatatcac aaccatacaa actaatcaga tataaagaag 43980 
tcagcaacag aaatctgatg ttgcctttag atcacacaat taggcaaaca aaaatagagt 44040 
tccatcctcc tttggtcaag gccatggttg aagactgaat accaaatagg gaaataggaa 44100 
aagccaggaa atggcaaatt agcaaaaact ggactcctta atttttatat tcattttcat 44160 
atctcacttc taaaacttta attaaattca aataaaaacc aaaatggaac tgagataaag 44220 
ccaaaaggaa agttatgtag gtcaaatgag aacctatatt gtccttaggc tctttgttgc 44280 
tttctgttta aggaaaaact gcccaagtgc cttgacacat taaagatcaa gcaggaggtt 44340 
ctgccgagag tccccatctg gcagccaggt tttgtcaagc aaattttgag aattctctac 44400 
cctcccactt tctatctaat tatagcactt tataaaaacc attctctctc tgtctctgtc 44460 
tctctctctc tctctctctc acacacacac acacacacac acacacacac acacacaccc 44 520 
tttctctctc tctctctctg aaacttatct gtattataat aacacaacac taggtatgga 44580 
ttaatctgac aattttcccc taaaacagaa taaattcaaa aaggaaaacc ttccctctgt 44 640 
acacatgcac tatattctga caataataat tcctaaatta agtataatac attttcccta 44700 
caggagttta aagaagttac agtaaagaat ctcttgtata aatatatatg ccagaacttg 44760 
acccaaataa gtgctgagag gtataaatct caaaacagtt tccggactct ttgtgaaatg 44820 
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tcttcagagt ctgcgatata ttttcttcaa ctaaattata caagtaagat at tttgcugg 44880 
gctgtgggaa tgccttacgg catgttactg tggagctcat ggtaaaatag aaagaatata 44940 
aataattaaa ataaaattga caaatgataa atgatttaat aaattagaaa ttcaaacgcc 45000 
gggcactttt ctagaacctg gacacaaagc atgaacctaa caataacccc gccttcatga 45060 
aaaatatgga ctatttgaaa attatacctg caacactaaa taaatattct tcattcttcc 45120 
agtatattga gatgtttact ttcaattaga caatttgctt tcctctctga acacatagtt 45180 
atgtgatggc tctataaaag attttaaaat aactatagaa ggaactattg gtaaagacrg 45240 
tgggatacta aaaatggcta caaagaaagt tatgacaaaa cctctgagrt tgaatggaag 45300 
tcctactaga ttagagtcta agcctgtgac attatgcttc tggttcttgt tcttaaatgc 45360 
ttttctcatt aatagtatgt aacttacttc ctggaatgcc attcattaaa aaaatattta 45420 
atatttgcta aatgtcaata tttatgccag cacttttaaa gtacagaaac atggagtttc 45480 
tttacctcat gcaaatatgc tgtgagaaag acttaagagc ctattgccta ctttgtggta 45540 
caacactgaa gactcaccat ccaaaacaaa cagacttagt aaattcttgt gatttgcagt 45600 
agttctgttc tataaggtta ccacaaacac tgaaatcatc gctcctgggg gaatacaagg 4 5660 
ttatgtttcc gtgagccctc ggtcacaaca tgttcattaa ctgatcaata cataaccttg 45720 
ttctatgtgt gtttctgttt aaaaagagca cttcagtgct acatttggag tctgttttaa 45780 
acagcaaaat cactaataaa aagcacaaaa atgtaaaagc atggcactac atacactgtg 45840 
acaagaaggc ttgtttarag tatgacagct gagacaagaa ggtagagcct cgcrttgatc 45900 
aacctctgct gggaaatgag catcaggtga atcaattttt caccactctg aatgaccgta 45960 
aaagtgctcc aagtactgac tttggggtta cacataaatt ttagtaagca tgtgaatctg 46020 
ccaatatgaa atctacaaat aatgagtacc aaatgcatat gagtcaaata tttcagtgcg 46080 
gtatctgact tgattgccac tgaaagacac agtttggaaa acccctaata aataccgttt 46140 
agttactatg cagacaaaga gttctacact agagtgcttc aattaagatg tctgaggctt 46200 
tcataaatgg atgtttttta aaatgttatt tcctacctga tatattctaa aggggatata 46260 
acgaaatcca ttttcttctg caggatattc catgagtttc cgattgatgg cccaaaactg 46320 
gtcaaatctg tctgtaatga 46340 



<210> 67 
<211> 773 
<212> ADN 

<213> Homo sapiens 



<400> 67 

actgagagac 

gaaggtgacc 

gaaggtgacc 

caggtagtaa 

aatcaaatca 

aggcatttga 

gttttcactc 

aagctgagct 

gacttccacc 

cattgccact 

gttcatccta 

cagcttctaa 

atgaggccaa 



aggactagct 
acatccacct 
acaccctcct 
agagagctca 
tctatcgcct 
gccagatcag 
tattaaatct 
tttgctcgcc 
cctccggatc 
cccgatcagg 
atcaggctga 
tagagctata 
gaaccccagg 



ggatttccta 
ttaaacacgg 
ttaaacacag 
ctaaaatacc 
gagagcacag 
gtaaccctct 
tgcaactgca 
gtccaccact 
cggcagagtg 
ctaaaggctt 
acactggtcg 
acactcacca 
tcagagaata 



ggctgactaa 
ggcttgcaac 
agcttgtaac 
aattaggcta 
ggggagggac 
ttgggtcccc 
cactcttctg 
gctgaatgcc 
tccgctgcac 
gccattgttc 
ctgggttcca 
catggcccaa 
aaaggcccgc 



gaatccctaa 
ttagctcaca 
tcagctcaca 
aaaacaggag 
aatgatcggg 
tcacactgta 
gtccatgttt 
gccat tgcag 
tcctgatcca 
ctgcacagct 
cggttctctt 
ggttccattc 
cccatcttgg 



gcctagctgg 
cctgaccaag 
cccgaccaat 
gtaaagaaat 
atataaaccc 
tgggagctct 
gttccggctc 
acctgccctt 
gcgaggcacc 
aagtgcctgg 
ccatgactca 
gttggaatcc 
gag 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

773 



<210> 68 
<211> 10 
<212> PRT 

<213> Homo sapiens 



<400> 68 

Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val 
15 10 



WO 99/67395 



PCT/FR99/01513 



<210> 69 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 69 

Leu Leu Phe Gly Pro Cys He Phe Asn Leu 
15 10 



<210> 70 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 70 

Cys Leu Pro Leu Asn Phe Arg Pro Tyr Val 
15 10 



<210> 71 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 71 

Gly Leu Leu Ser Gin Trp Met Pro Trp He 
15 10 



<210> 72 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 72 

Cys Leu Pro Ser Gly He Phe Phe Val 
1 5 



<210> 73 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 73 

Trp Met Pro Trp He Leu Pro Phe Leu 
1 5 
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<210> 74 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 74 

lie Arg Trp Val Thr Pro Pro Thr Gin lie 
15 10 



<210> 75 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 75 

Leu Arg Asn Thr Gly Pro Trp Gly Leu Leu 
15 10 



<210> 76 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 76 

Leu Arg Thr His Thr Arg Leu Val Ser Leu 
15 10 



<210> 77 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 77 

Lys Arg Val Pro lie Leu Pro Phe Val lie 
15 10 



<210> 78 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 78 

Cys Arg Cys Met Thr Ser Ser Ser Pro Tyr 
15 10 
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<210> 79 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 79 

Thr Arg Val His Gly Thr Ser Ser Pro Tyr 
15 10 



<210> 80 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 80 

Ala Arg Glu Lys His Val Lys Glu Val lie 
1 5 10 



<210> 81 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 81 

Ser Arg lie Glu Ala Val Lys Leu Gin Met 
15 10 



<210> 82 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 82 

Ser Gin Trp Met Pro Trp lie Leu Pro Phe 
15 10 



<210> 83 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 83 

Cys Tyr Tyr Val Asn Gin Ser Gly lie 
1 5 
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<210> 84 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 84 

Phe Tyr Tyr "Lys Leu Ser Gin Glu Leu 
1 5 



<210> 85 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 85 

Thr Tyr Thr Thr Asn Ser Gin Cvs lie 
1 5 



<210> 86 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 86 

Ser Phe Leu Val Pro Pro Met Thr lie 
1 5 



<210> 87 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 87 

Tyr Tyr Val Asn Gin Ser Gly lie Val 
1 5 



<210> 88 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 88 

Leu Phe Asn Thr Thr Leu Thr Gly Leu 
1 5 
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<210> 89 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 89 

Leu Phe Gly Pro Cys lie Phe Asn Leu 
1 5 



<210> 90 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 90 

Arg Trp Val Thr Pro Pro Thr Gin lie 
1 5 



<210> 91 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 91 

Leu Pro Phe Leu Gly Pro Leu Ala Ala lie 
15 10 



<210> 92 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 92 

Leu Pro Tyr His lie Phe Leu Phe Thr Val 
15 10 



<210> 93 
<211> 10 
<212> PRT 
<213> Homo 



sapiens 



<400> 93 

Gly Ala Leu Gly Thr Gly lie Gly Gly He 
15 10 
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<210> 94 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 94 

Leu Pro Phe Val lie Gly Ala Gly Val Leu 
15 10 



<210> 95 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 95 

Arg Arg Pro Leu Asp Arg Pro Ala Ser 
1 5 



<210> 96 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 96 

Phe Arg Pro Tyr Val Ser lie Pro Val 
1 5 



<210> 97 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 97 

Arg Arg Ala Leu Asp Leu Leu Thr Ala 
1 5 



<210> 98 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 98 

Trp Arg Met Gin Arg Pro Gly Asn lie 
1 5 
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<210> 99 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 99 

Asp Arg He Gin Arg Arg Ala Glu Glu Leu 
15 10 



<210> 100 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 100 

Leu Arg Thr His Thr Arg Leu Val Ser Leu 
15 10 



<210> 101 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 101 

Glu Arg Val Ala Asp Ser Leu Val Thr Leu 
15 10 



<210> 102 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 102 

Leu Phe Gly Pro Cys He Phe Asn Leu Leu 
15 10 



<210> 103 
<211> 10 
<212> PRT 

<213> Homo sapiens 



<400> 103 

Gin Phe Tyr Tyr Lys Leu Ser Gin Glu Leu 
15 10 
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<210> 104 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 104 

Gin Trp Met Pro Trp lie Leu Pro Phe Leu 
15 10 



<210> 105 

<211> 10 

<212> PRT 

<213> Homo sapiens 

<400> 105 

Cys Tyr Tyr Val Asn Gin Ser Gly lie Val 
15 10 



<210> 106 

<2il> 10 

<212> PRT 

<213> Homo sapiens 

<400> 106 

Asn Phe Val Ser Ser Arg lie Glu Ala Val 
15 10 



<210> 107 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 107 

Gly Pro Leu Val Ser Asn Leu Glu lie 
1 5 



<210> 108 

<211> 9 

<212> PRT 

<213> Homo sapiens 

<400> 108 

Leu Pro Leu Asn Phe Arg Pro Tyr Val 
1 5 
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<210> 109 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 109 

Leu Pro Phe Leu Gly Pro Leu Ala Ala lie 
15 10 



<210> 110 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 110 

Glu Pro Lys Met Gin Ser Lys Thr Lys lie 
15 10 



<210> 111 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 111 

Leu Pro Tyr His lie Phe Leu Phe Thr Val 
15 10 



<210> 112 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 112 

Arg Glu Lys His Val Lys Glu Val lie 
1 5 



<210> 113 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 113 

Lys Pro Arg Asn Lys Arg Val Pro lie Leu 
15 10 
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<210> 114 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 114 

Val Val Leu Gin Asn Arg Arg Ala Leu 
1 5 



<210> 115 
<211> 10 
<212> PRT 

<213> Homo sapiens 
<400> 115 

Ala Val Val Leu Gin Asn Arg Arg Ala Leu 
15 10 



<210> 116 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 116 

Leu Pro Phe Val He Gly Ala Gly Val 
1 5 



<210> 117 
<211> 9 
<212> PRT 

<213> Homo sapiens 
<400> 117 

Asp Leu Tyr Ser Tyr Val He Ser Lys 
1 5 



<210> 118 
<211> 10 
<212> PRT 

<213> Homo sapiens 



<400> 118 

Thr Glu Gin Asp Leu Tyr Ser Tyr Val He 
15 10 
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<210> 119 
<211> 2615 
<212> ADN 

<213> Homo sapiens 



<400> 119 

gaattccggg 

agtgttgcgg 

gcccgggcgg 

gcactgtgag 

ggatgcggat 

gaacgaccac 

cttaccaagg 

gagtaaagaa 

caatgacaca 

ggagcttcac 

gaatccagca 

ctacttctac 

ggactttgca 

acaaacacag 

tgtcccaaag 

aggaaaggac 

ctttagaaga 

ggcccctctg 

gtacatcact 

ccccgaccaa 

tgtgggcccc 

cacggaaggt 

catcccctcg 

taatggcctg 

gctgtgccct 

ccccacttct 

gcatcccagg 

cgccagcatg 

cgccacggca 

cagcgacgaa 

tccctacccg 

gactttcggc 

tttcaaatgt 

cctggtacac 

caccagcaat 

ggtgtgccct 

ccgggagcgg 

caaggttcac 

tctgacccga 

cgaggacgtg 

ggtcagaaaa 

tggactcctc 

gcctcccagc 

aatggatcct 



aagccagacg 
agaggcaaga 
ccggacgaag 
gtttcaggga 
atgactctgt 
ccctgggatt 
aatctgcttt 
tacataccaa 
gttcctaaga 
cacttcattg 
cactctcccc 
accattaagc 
gaaaggcttc 
agcagtctaa 
agagagtaca 
ctctaccgtt 
cgtgggagcc 
ccagaagact 
cgctccccca 
agcctcaaga 
ggctctcaag 
ttgggctcct 
tacaacgctc 
agcgctgtga 
gtctacagca 
ctcccgagct 
gaggtgcttg 
aaggacaagg 
gaacatgtgg 
gccatgaatc 
ctgaagaagc 
cagctctcca 
cagacttgca 
acgggagaaa 
ctcaagaccc 
gccaagttca 
ccccacaagt 
ctgaaaggga 
atcaatgaag 
gaggatgaca 
gagaaagaag 
tcctcagggt 
aacccactac 
taagattttc 



gttaacacag 
gcagcgaccg 
cgaggaggga 
ttggcagagg 
ggacagaggc 
ctggtgctga 
tcaagtatgc 
agggcacacg 
acgccaacag 
acggctttaa 
gggagcaaaa 
ccatccctgc 
actaccctta 
agcaaccgag 
gcgtgaaaga 
ctaacatttc 
ccgaaatgcc 
ttttgaaagc 
ttccatcctc 
gctccagccc 
agcaccggga 
accctggcta 
actaccccaa 
gcagcatgaa 
atctcctcgg 
cgctgccctc 
tcccggcgcc 
cctgtagccc 
tgcagcccaa 
tcattaaaaa 
agaacggcaa 
atctgaaggt 
acaagggctt 
agccacatga 
acctgcgact 
cccagtttgt 
gctcccagtg 
actgcgctgc 
aaatcgagaa 
tcagtgtgat 
aaactggcct 
gcagccttta 
ctctggtacc 
agaaaacact 



acaaagtgct 
cgcacctgtc 
ccgccgaggc 
ggaccaaggg 
tgagtttgaa 
tggcggtact 
caccaacagt 
ttttggaccc 
gaaatatttt 
tgaagagaaa 
cctggctgcg 
caaccaggaa 
tcccggagag 
cactgagaaa 
aatcctaaaa 
acccctcaca 
cttctaccct 
ttccctggcc 
caccactcca 
tcacagcagc 
ctcctacgct 
cgcacccctg 
gttcctcttg 
tggcatcaac 
tgggggcagc 
agatggagcc 
ccacagtgcc 
cacaagcggg 
agctacctca 
caaaagaaac 
gatcaagtac 
ccacctgaga 
tactcagctc 
atgccaggtc 
ccattctgga 
gcacctgaaa 
ccacaagaac 
ggccccggcg 
gtttgacatc 
ctctgtagtg 
gaaagtgtct 
tgagtcatca 
tgtaaaggtc 
tattt 



gccgtgacac 
cgcccggagc 
tgcccccaag 
gacatgaaaa 
gagaagtgta 
tcggttcagg 
gaagaggtta 
ctaataggtg 
tggaggatct 
agcaactgga 
tgtcagaacg 
cttcttgtgt 
ctgacaatga 
aatgaactct 
ttggactcca 
tcagaaaagg 
cgggtcgttt 
tacgggatcg 
agcccctctg 
cctgggaata 
tacttgaacg 
ccccacctcc 
cccccctacg 
aactttggcc 
ctgccccacc 
cggaggttgc 
ttctccttta 
tctcccacgg 
gcagcgatgg 
atgaccggct 
gaatgcaacg 
gtgcacagtg 
gcccacctgc 
tgccacaaga 
gagaaaccat 
ctgcacaagc 
tacatccatc 
cctgggctgc 
agtgacaatg 
gagaaggaaa 
ttgcaaagaa 
gatctacccc 
aaacaagaaa 



tcggccctcc 
tgggacgcgc 
tgtaactcca 
tggacatgga 
catacattgt 
cggaggcatc 
ttggagtgat 
aaatctacac 
attccagagg 
tgcgctatgt 
ggatgaacat 
ggtattgtcg 
tgaatctcac 
gcccaaagaa 
acccctccaa 
acctcgatga 
accccatccg 
agagacccac 
caagaagcag 
cggtgtcccc 
cgtcctacgg 
cgccagcttt 
gcatgaattg 
tcttcccgag 
ccatgctcaa 
tccagccgga 
ccggggccgc 
cgggaacagc 
cagcccccag 
acaagaccct 
tttgcgccaa 
gagaacggcc 
agaaacacta 
gatttagcag 
accaatgcaa 
gtctgcacac 
tctgtagcct 
ccttggaaga 
ctgaccggct 
ttctggccgt 
acatggggaa 
tcatgaagtt 
cagttgaacc 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2615 



<210> 120 
<211> 29 
<212> PRT 

<213> Homo sapiens 
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<400> 120 

Leu Gin Asn Arg Arg Ala Leu Asp Leu Leu Thr Ala Glu Arg Gly Gly 
15 10 15 

Thr Cys Leu Phe Leu Gly Glu Glu Cys Cys Tyr Tyr Val 
20 25 



<210> 121 

<211> 21 

<212> ADN 

<213> Homo sapiens 

<400> 121 

cttcaaacaa caaccaggag g 21 



<210> 122 

<211> 20 

<212> ADN 

<213> Homo sapiens 



<400> 122 

ttggggaggt tggccgacga 



20 
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cannot be considered to involve an inventive step when the 
document is combined with one or more other such docu- 
ments, such combination being obvious to a person skilled 
In the art 

document member of the same patent family 



Date of the actual completion of the international search 

18 October 1999 


Date of mailing of the international search report 

J I tL a 


Name and mailing address of the ISA 

European Patent Office, P.B. 581 8 Patenttaan 2 

NL-2280HVRijswtf< 

Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 

Fax (+31-70) 340-3016 


Authorized officer 

Cupido, M 
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Category ° Citation of document, with indication, where appropriate, of the relevant passages 



Relevant to^laim No. 



p,x 



p.x 



p,x 



ALLIEL PM ET AL: "Sequences retrovi rales 

endogenes anlogues a celle du nouveau 

retrovirus MSRV associe a la sclerose en 

plaques ( premiere partie)" 

COMPTES RENDUS DES SEANCES DE L'ACADEMIE 

DES SCIENCES SERIE III: SCIENCES DE LA 

VIE., 

vol. 321, no. 6, June 1998 (1998-06), 
pages 495-499, XP002101380 
MONTREUIL FR 
figures 2,3 

Database GenBank Sequence AC X93499 
mRNA de H. sapiens pour la proteine rab7 
10 fevrier 1997 
XPO02119234 

6 VITELLI R ET AL: "Molecular cloning and 
expression analysis of the human rab7 
GTP-ase complementary deoxyribonucleic 
acid" 

BIOCHEMICAL AND BIOPHYSICAL RESEARCH 
COMMUNICATIONS, 

vol. 229, no. 3, 1996, pages 887-890, 
ORLANDO, FL US 

FR 2 737 500 A (BIO MERIEUX) 

7 February 1997 (1997-02-07) 
cited in the application 
the whole document 

W0 99 02666 A (BIO MERIEUX) 

21 January 1999 (1999-01-21) 

Comparez SEQ ID NOs 130, 117, 114 et 120 

avec SEQ ID NOs: 1-3 de cette demande et 

SEQ ID NO: 118 avec SEQ ID N0s:22 et 120 de 

cette demande 

WO 99 02696 A (BIO MERIEUX ;BESEME 
FREDERIC (FR); BLOND JEAN LUC (FR); BOUTON 
OLI) 21 January 1999 (1999-01-21) 
Comparez SEQ ID NOs: 4, 5, 7, 9 et 11 avec 
SEQ ID NOs: 1-3 de cette demande. 

ALLIEL PM ET AL: "Retrovirus endogenes et 
sclerose en plaques. II. HERV-7q" 
COMPTES RENDUS DES SEANCES DE L'ACADEMIE 
DES SCIENCES SERIE III: SCIENCES DE LA 
VIE., 

vol. 321, no. 10, October 1998 (1998-10), 
pages 857-863, XP002101381 
MONTREUIL FR' 
the whole document 



1,3-12, 
14-36 



1-4 



1,3-12, 
14-36 



1,3-12, 
14-36 



1,3-12, 
14-36 



1,3-12, 
14-36 
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C(Continuation) DOCUMENTS CONSIDERED TO BE RELEVANT 



Category ° Citation of document, with indication, where appropriate, of the relevant passages 



Relevant to^slaim No. 
4 



WO 99 26972 A (GENETICS INSTITUTE, INC.) 
3 June 1999 (1999-06-03) 
comparez SEQ ID N0:4 avec a. a. 131-668 de 
sequence 22 de cette demande 

MITANI M ET AL: "Suppressive effect on 
polyclonal B-cell activation of a 
synthetic peptide homologous to a 
transmembrane component of oncogenic 
retrovirus" 

PROCEEDINGS OF THE NATIONAL ACADEMY OF 
SCIENCES OF USA, 

vol. 84, no. 1, January 1987 (1987-01), 

pages 237-240, XPO02118729 

WASHINGTON US 

cited in the application 

the whole document 
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Form PCT/tSA/210 (continuation of second sheet) (July 1992) 
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INTERNATIONAL SEARCH REPORT 


International application No. 




PCT/FR 99/01513 



Box I Observ ations where certain claims were found unsearchable (Continuation of item 1 of ljrst sheet) 



This international search report has not been established in respect of certain claims under Article 1 7 (2)(a) for the following reasons : 
1. j I Claims Nos.: 

1 — ' because they relate to subject matter not required to be searched by this Authority, namely: 



2. [XJ Claims Nos.: 8 

because they relate to parts of the international application that do not comply with the prescribed requirements to such 
an extent that no meaningful intemauonal search can be carried out, specifically: 

See supplemetary sheet INFORMATION FOLLOW-UP PCT/ISA/210 

3. [ I ClaimsNos.: 

— . because they are dependent claims and are not drafted in accordance with the second and third sentences of Rule 6.4(a). 
Box II Observ ations where unit}' of invention is lacking (Continuation of item 2 of first sheet) 
This International Searching Authority found multiple inventions in this international application, as follows: 

See supplementary sheet 



1 . | [ As all required addiuonal search fees were timely paid by the applicant, this intemauonal search report covers all 
searchable claims. 



2. 



X As all searchable claims could be searched without effort justifying an additional fee, this Authority did not invite payment 
of any additional fee. 



3. I I As only some of the required additional search fees were timely paid by the applicant, this intemauonal search report 
— covers only those claims for which fees were paid, specifically claims Nos. : 



4. I | No required addiuonal search fees were timely paid by me applicant Consequently, this international search report is 
' — ' restricted to the invention first mentioned in the claims; it is covered by claims Nos. : 



Remark on Protest [^] The addiuonal search fees were accompanied by the applicant's protest. 

[ | No protest accompanied the payment of additional search fees. 



Form PCT/ISA/210 (continuation of first sheet (1)) (July 1992) 



INTERNA!*^ .iL SEARCH REPORT a 



ttanational application No. 
PCT/FR 99/01513 



The International Searching Authority found several (groups of) inventions in 
the international application, namely: 

1. Claims: 1, 9, 21-23, 26 (wholly), 28, 10-20 and 27-37 (partly) 

Nucleic acid fragments derived from HERV-7q env, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

2. Claims: 2-7, 10-20, 27-37 (all partly) 

Nucleic acid fragments derived from HERV-7q gag, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

3. Claims: 2-7, 10-20, 27-37 (all partly) 

Human nucleic acid fragments similar to HERV-7q gag, diagnostic reagents, 
diagnostic applications and kits, peptides, pharmaceutical compositions and 
applications, antibodies and corresponding transgenic animals. 

4. Claims: 24, 25 

Compositions comprising a CKS-type motif, inasmuch as said compositions do 
not contain a sequence as per the first invention. 



INTERNAlwiiAL SEARCH REPORT k .Latiotial application No. 

PCT/FR 99/01513 



■9 



Continuation of Box 1.2 
Claim No: 8 



Claim 8 concerns a very wide variety of compounds. A support basis as defined 
in PCT Article 6 and a description as defined in PCT Article 5 can however be 
found for only a very, limited number of the claimed compounds. In the present 
case, the claims are so lacking in support basis and the disclosure of the 
invention in the description is so limited that it is impossible to carry out any 
significant search concerning the whole claimed spectrum. 

The applicant's attention is drawn to the fact that claims concerning inventions 
in respect of which no search report has been established need not be the subject 
of a preliminary examination report (PCT Rule 66.1 (e)). The applicant is 
warned that the guideline adopted by the EPO acting in its capacity as 
International Preliminary Examining Authority is not to proceed with a 
preliminary examination of a subject matter unless a search has been carried out 
thereon. This position will remain unchanged, notwithstanding that the claims 
have or have not been modified, either after receiving the search report, or 
during any procedure under Chaper II. 



INTERN, ^)NAL SEARCH REPORT 

v J 

h.-^rmatton on patent family members 



Infema' y Application No 

PCT/KR 99/01513 



Patent document 
cited in search report 


Publication 
date 


Patent family 
members) 


Publication 
datey 


WO 9823755 


A 


Ail AC Ifl AO 

04-06-1998 


EP 


0942987 A 


22-09-1999 


FR 2737500 


A 


07-02-199/ 


AU 


6823296 A 


AC AO 1 ft07 

05-03-199/ 








BG 


101355 A 


OA lO 1 AA7 

30-12-199/ 








BR 


9606566 A 


OA lO 1 AAT 

30-12-1997 








CA 


2201282 A 


OA AO 1 f\A7 • 

20-82-199/ 








CZ 


9701357 A 


1 "T AC 1 AAO ^ 

17-06-1998 








• EP 


0789077 A 


1 O AO f nn7 

13-08-1997 








t IA 

WO 


ATACOCA A 

9706260 A 


OA AO 1 AAT 

20-02-1997 








HI) 


9900425 A 


OO AC 1AAA 

28-05-1999 








JP 


11502416 T 


02-03-1999 








klA 

NO 


AT A A AO A 

971493 A 


03-06-1997 








NZ 


316080 A 


29-04-1999 








PL 


319512 A 


18-08-1997 








SK 


56797 A 


09-09-1998 


WO 9902666 


A 


21-G1-1999 


FR 


2765588 A 


08-01-1999 








AU 


8545098 A 


08-02-1999 


WO 9902696 


A 


21-01-1999 


AU 


8447098 A 


08-02-1999 


WO 9926972 


A 


03-06-1999 


AU 


1417899 A 


15-06-1999 



9 



Form PCT/lSA/210 (patent famtty annex) (July 1992) 



RAPPORT DE REV^yRCHE INTERNATIONALE 



A- 



Internationale No 

PCT/FR 99/01513 



A. CLASSEMENT DE L'OBJET DE LA DEMAND E 

CIB 6 C12N15/48 C12Q1/70 



C07K14/15 A61K31/70 



Selon la classification Internationale des brevets (CIB) ou a la fois selon ta classification rationale et la CIB 



B. DOMAINES SUR L ESQ U ELS LA RECHERCHE A PORTE 



Documentation minimale~consultee (systems de classification suivi des symboles de classement) 

CIB 6 C12N C12Q C07K A61K 



Documentation consulted autre que la documentation minimale dans ta mesure ou ces documents relevent des domaines sur lesquels a porte la recherche 



Base de donnees electronique consuttee au cours de la recherche Internationale (nom de la base de donnees, et si realisable, termes de recherche utilises) 



C. DOCUMENTS CONStDERES COMME PERTINENTS 



Categorie • Identification des documents cites, avec, le cas echeant, I'indication des passages pertinents 



no. des revendications visees 



WO 98 23755 A (BIO MERIEUX) 

4 juin 1998 (1998-06-04) 

Comparez nucleotides 1-1462 de SEQ ID 

N0:117 avec nucleotides 928-2390 de SEQ ID 

N0:1 de la presente deraande; comparez SEQ 

ID NO: 118 avec SEQ ID N0s:22 et 120 de la 

presente demande 

Database GenBank. Sequence HSAC 000064 
Clone hurnain BAC RG083M05 de 7q21-7q22, 
sequence complet. 17 novembre 1996. 
XP002118730 

Comparez nucleotides 28000-38500 d' 
AC00064 avec SEQ ID NO: 3 

-/- 



1,3-12, 
14-36 



1-4,13 



m 



Voir ia suite du cadre C pour la fin de la liste des documents 
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Les documents de families de brevets sont irtdiques en annexe 



° Categories specials s de documents cites: 

"A" document deftnissant fetat general de la technique, non 

considers comme particulierement pertinent 
"E" document anterieur, mais publie a ta date de depdt international 

ou apres cette date 
I s document pouvant jeter un doute sur une revendication de 

priorite ou cite pour determiner la date de publication dune 

autre citation ou pour une ratson specials (telle qulndtquee) 
"O" document se referant a une divulgation orate, a un usage, a 

une exposition ou tous autres moyens 

"P" document pubtle avant la date de depdt international, mats 
posterieurement a la date de priorite revendiquee 



"T H document ulterieur publie apres la date de depot international ou la 
date de priorite et n'appartenenant pas a I'etat de la 
technique pertinent, mais cite pour comprendre le principe 
ou la theorie constituant ta base de invention 

"X" document particulierement pertinent; Tinven tion revendiquee ne peut 
etre consideree comme nouvelte ou comme impliquant une activrte 
inventive par rapport au document considere isolement 

"Y H document particuJierement pertinent; Tinven tion revendiquee 
ne peut etre consideree comme impliquant une activrte inventive 
lorsque le document est associe a un ou plusieurs autres 
documents de meme nature, cette combinaison etant evidente 
pour une perconne du metier 

"&" document qui fait partie de ta meme famiile de brevets 



Date a laquelle ta recherche Internationale a ete effectivement achevee 



18 octobre 1999 



Date d 1 expedition du present rapport de recherche Internationale 



n ti 99 



Nom et adresse postale de ('administration chargee de la recherche Internationale 
Office Europeen des Brevets, P.B. 5818 Patentlaan 2 
NL-2280HVRi|swqk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl. 
Fax: (+31-70) 340-3016 



Fonctionnaire autorise 



Cupido, M 



RAPPORT DE RitaffiRCHE INTERNATIONALE 



^.!U Internationale No 

PCT/FR 99/01513 



C(sute) DOCUMENTS CONSIDERES COM ME PERTINENTS 


Categorte 0 


Identification des documents cites, avec.le cas echeant, rtndlcattondes passages pertinents . 


rx>. des r&endicattons visees 


X 


ALLIEL PM ET AL: "Sequences retrovirales 
endogenes anlogues a celle du nouveau 
retrovirus MSRV associe a la sclerose en 
plaques ( premiere parti e)" 
COMPTES RENDUS DES SEANCES DE L'ACADEMIE 
DES SCIENCES SERIE 111: SCIENCES DE LA 
VIE. , 

vol. 321, no. 6, juin 1998 (1998-06), 
pages 495-499, XP002101380 
MONTREUIL FR 
figures 2,3 


1,3-12, 
14-36 


X 


Database GenBank Sequence AC X93499 
mRNA de H. sapiens pour la proteine rab7 
10 fevrier 1997 
XP0021 19234 

& VITELLI R ET AL: "Molecular cloning and 
expression analysis of the human rab7 
GTP-ase complementary deoxyribonucleic 
acid" 

BIOCHEMICAL AND BIOPHYSICAL RESEARCH 
COMMUNICATIONS, 

vol. 229, no. 3, 1996, pages 887-890, 
ORLANDO, FL US 


1-4 


X 


FR 2 737 500 A (BIO MERIEUX) 
7 fevrier 1997 (1997-02-07) 
cite dans la demande 
le document en entier 


1,3-12, 
14-36 


p,x 


W0 99 02666 A (BIO MERIEUX) 

21 janvier 1999 (1999-01-21) 

Comparez SEQ ID NOs 130, 117, 114 et 120 

avec SEQ ID NOs: 1-3 de cette demande et 

SEQ ID NO: 118 avec SEQ ID NOs : 22 et 120 de 

cette demande 


1,3-12, 
14-36 


p,x 


W0 99 02696 A (BIO MERIEUX ;BESEME 
FREDERIC (FR); BLOND JEAN LUC (FR); BOUTON 
OLI) 21 janvier 1999 (1999-01-21) 
Comparez SEQ ID NOs: 4, 5, 7, 9 et 11 avec 
SEQ ID NOs: 1-3 de cette demande. 


1,3-12, 
14-36 


p,x 


ALLIEL PM ET AL: "Retrovirus endogenes et 
sclerose en plaques. II. HERV-7q" 
COMPTES RENDUS DES SEANCES DE L'ACADEMIE 
DES SCIENCES SERIE III: SCIENCES DE LA 
VIE., 

vol. 321, no. 10, octobre 1998 (1998-10), 
pages 857-863, XP002101381 
MONTREUIL FR 

ie uucuiiitMiu en enuier 

-/- 


1,3-12, 
14-36 
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RAPPORT DE RL^ERCHE INTERNATIONALE 


Dema Internationale No 

PCT/FR 99/01513 


C^sute) DOCUMENTS CONSIDERES COM ME PERTINENTS 


Categorto c 


Identification des documents cites, avec.le cas echeant. I'indicationdes passages pertinents 


no. des revindications visees 
*** 


P.X 


WO 99 26972 A (GENETICS INSTITUTE, INC.) 
3 juin 1999 (1999-06-03) 
comparez SEQ ID N0:4 avec a. a. 131-668 de 
sequence 22 de cette demande 




1-4 


A 


MIT AN I M ET AL: "Suppressive effect on 
polyclonal B-cell activation of a 
synthetic peptide homologous to a 
transmembrane component of oncogenic 
retrovirus" 

PROCEEDINGS OF THE NATIONAL ACADEMY OF 
SCIENCES OF USA, 

vol. 84, no. 1, janvier 1987 (1987-01), 
pages 237-240, XP0021 18729 
WASHINGTON US 
cite dans la demande 
le document en entier 




24,25 * 



RAPPORT DE RECHERCHE INTERNATIONALE 



C ande Internationale n° 

PCT/FR 99/01513 



Cadre I Observation -I rsqu'il a ete estime que certaines rev ndicati ns ne pouvaient pas fair© r biet d une recherche 
(suite du point 1 de la premier feuill ) 1 



Conformement a l'artide~1 7.2)a), certaines revendtcattons n'ont pas fait Tobjet d'une recherche pour les motifs suivants: 

t. | [ Les revendications n°* 

se rapportent a un objet a I'egard duquel ('administration n'est pas tenue de prooeder a ta recherche, a savoir 



| ^ | Les revendicatiorts n 08 8 

se rapportent ades parties de la demande Internationale qui ne remplissent pas suffisamment les conditions preserves pour 
qu une recherche significative putsse etre effectuee, en particulier: 

voir feuille supplemental re SUITE DES RENSEIGNEMENTS PCT/ISA/219 



| | Les revendications n OB 

sont des revendications dependantes et ne sont pas redigees conformement aux dispositions de la deuxieme et de la 
troisieme phrases de la regie 6. 4 a). 



Cadre II Observations - lorsqu'il y a absence d'unite de (Invention (suite du point 2 de la premiere feuiUe) 



^administration charges de la recherche Internationale atrouve piusieurs inventions dans la demande Internationale, as 

voir feuille supplementaire 



* D iSL*"^ ^temnelles Pay^s dans les delais par le deposant, le present rapport de recherche 

Internationale porte sur toutes les revendicatiorts pouvant fair© I'objet d'une recherche. 



Cornmetoutes les recherehes portent sur les revendications qui sV prdtaient ont pu etre effectives sans effort particulier 
lusfafiant une taxe addrtwnnelle, radmmistration n'a sollieite le paiement d'aucunetaxe de eette nature. ^ 



3 EH S^ZT^^f e w Bme H- **, ,aXeS adtfitjonnelles demandees a ete payee dans les delais par le deposant, le present 
^^ndiSslT" °" " e "* ,6S revendications P°" r te^quelles les taxes ont ete payees, a savoir 



4. Q Aucune taxe addrtionnelle demandee n a ete payee dans les delais par le deposant En consequence, le present rapport 
ctu^r^ r^d^^ - ^ " '' inVerti0n men,ionn6e « P rem »r lieu dans les revendications; elle esr 



Remarque quant a la reserve 



□ 
□ 



Les taxes additionneiles etaient accompagnees d'une reserve de la part du deposan . 
Le paiement des taxes additionneiles n'etait assorti d'aucune reserve. 



Demande Internationale No. PCT/FR 99/91513 



SUrtE DES RENSEIGNEMENTS INDIQUES SUR PCT/ISA/ 210 



Suite du cadre 1.2 
Revendi cations nos.: 8 



Le revendi cation 8 presente a trait a une tres grande variete de 
composes. Un fondement au sens de L'Article 6 PCT et un expose au sens de 
1' Article 5 PCT ne peut cependant etre trouve que pour un nonbre tres 
restreint de ces composes revendi ques. Dans le cas present, les 
revendi cations manquent a un tel point de fondement et V expose de 
1'invention dans la description est si limite jq'une recherche 
significative couvrant tout le spectre revendique est impossible. 

L 1 attention du deposant est attiree sur le fait que les revendi cations, 
ou des parties de revendi cations, ayant trait aux inventions pour 
lesquelles aucun rapport de recherche n'a ete etabli ne peuvent faire 
obligatoirement Tobjet d'un rapport preliminaire d'examen (Regie 66.1(e) 
PCT). Le deposant est averti que la ligne de conduite adoptee par l'OEB 
agissant en qualite d 1 administration chargee de 1 'examen preliminaire 
international est, normal ement, de ne pas proceder a un examen 
preliminaire sur un sujet n'ayant pas fait 1 'objet d'une recherche. Cette 
attitude restera inchangee, i ndependanment du fait que les revendi cations 
aient ou n'aient pas ete modifiees, soit apres la reception du rapport de 
recherche, soit pendant une quelconque procedure sous le Chapitre II. 



Demands internationals No. PGT/FR 99/01513 



SUITE DES RENSEIGNEMENTS INDIQUES SUR PCT/1SA/ £10 



L 1 administration chargee de la recherche Internationale a trouve 
plusieurs (groupes d 1 ) inventions dans la demande international, a 
savoir: 

1. revendi cations: 1, 9, 21-23, 26 (complet), 28, 
10-28 et 27-37 (partiellement) 



Fragments d'acide nucleique derive du HERV-7q env, reactifs 
de diagnostic, applications et kits diagnostiques, peptides, 
compositions et applications pharmaceutiques, anticorps et 
animaux transgeniques correspondants. 



2. revendi cations: 2-7, 10-20, 27-37( tous partiellement) 

Fragments d'acide nucleique derive du HERV-7q gag, reactifs 
de diagnostic, applications et kits diagnostiques, peptides, 
compositions et applications pharmaceutiques, anticorps et 
animaux transgeniques correspondants. 



3. revendi cations: 2-7, 10-20, 27-37 ( tous partiellement) 

Fragments d'acide nucleique humaines similaires a HERV-7q 
(SEQ ID NOs: 4-21 et 61), reactifs de diagnostic, 
applications et kits diagnostiques, peptides, compositions 
et applications pharmaceutiques, anticorps et animaux 
transgeniques correspondants. 



4. revendi cations: 24, 25 

Compositions comprenant un motif de type CKS, dans la me sure 
ou ces compositions ne contiennent pas une sequence selon la 
premiere invention. 
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au rapport de recherche 




publication 


famille de brevet(s) 


publication 
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FP 
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A 
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AU 


6823296 A 


05-03-1997 








BG 
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30-12-1997 








BR 


9606566 A 


30-12-1997 








CA 


2201282 A 


20-02-1997 








cz 


9701357 A 


17-06-1998' 








EP 


0789077 A 


13-08-1997 








WO 


9706260 A 


20-02-1997 








HU 


9900425 A 


28-05-1999 








JP 


11502416 T 


02-03-1999 








NO 


971493 A 
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